资源编号
11074最后更新
2025-04-02《大模型轻量化微调实操手册(V1.0)》电子书下载: 大模型轻量化微调实操手册总结 一、项目背景与费用消耗 背景 本手册记录了基于Qwen2.5-7B-Instruct大模型进行微调,以……
哈喽!伙伴们,我是小智,你们的AI向导。欢迎来到每日的AI学习时间。今天,我们将一起深入AI的奇妙世界,探索“《大模型轻量化微调实操手册(V1.0)》电子书下载”,并学会本篇文章中所讲的全部知识点。还是那句话“不必远征未知,只需唤醒你的潜能!”跟着小智的步伐,我们终将学有所成,学以致用,并发现自身的更多可能性。话不多说,现在就让我们开始这场激发潜能的AI学习之旅吧。
《大模型轻量化微调实操手册(V1.0)》电子书下载:
大模型轻量化微调实操手册总结
一、项目背景与费用消耗
背景
本手册记录了基于Qwen2.5-7B-Instruct大模型进行微调,以实现酒店推荐的垂直大模型。
费用消耗
微调过程共消耗88分钟,费用为2.08元/小时,总计花费3.05元。
二、训练环境准备
注册与认证
在AutoDL官网进行账号注册并实名认证。
GPU选择与实例创建
使用AutoDL的4090云GPU作为训练测试环境。
选择开源社区镜像agiclass/fine-tuning-lab/finetune-lab-v8,该镜像已配置好微调所需依赖包环境。
创建实例后,状态为“运行中”表示创建完成并开始计费。
三、微调前准备工作
连接实例
使用SSH客户端(如Termius)远程登录服务器,并连接SFTP服务进行文件传输。
下载预训练模型
从HuggingFace的镜像网站hf-mirror.com下载Qwen2.5-7B-Instruct模型。
使用命令行进行模型下载,下载时间大约30分钟。
上传代码
将代码压缩为zip包并通过SFTP上传至服务器。
解压代码包至指定目录。
四、微调进行中
训练
使用LoRA进行微调训练,命令行执行bash train.sh。
训练耗时约45分钟,生成文件位于/root/autodl-tmp/fine-tuning-lab/qwen2/output目录下。
训练过程可视化
使用TensorBoard工具可视化训练过程中的loss。
运行命令tensorboard –logdir=output/hotel-qwen2-20240720-16221221 –bind_all。
可通过AutoDL实例的自定义服务访问TensorBoard可视化页面。
五、微调后测试
在测试集上进行推理测试,计算SLOT和BLEU指标。
修改eval.sh文件中的checkpoint路径。
执行bash eval.sh进行测试,耗时约13分钟。
六、模型使用
使用提供的web_demo代码进行模型使用测试。
修改own2_lotra.sh文件中的参数以使用训练后的模型。
执行相应命令进行测试。
通过以上步骤,可以实现基于Qwen2.5-7B-Instruct大模型的酒店推荐垂直大模型的微调与应用。
嘿,伙伴们,今天我们的AI探索之旅已经圆满结束。关于“《大模型轻量化微调实操手册(V1.0)》电子书下载”的内容已经分享给大家了。感谢你们的陪伴,希望这次旅程让你对AI能够更了解、更喜欢。谨记,精准提问是解锁AI潜能的钥匙哦!如果有小伙伴想要了解学习更多的AI知识,请关注我们的官网“AI智研社”,保证让你收获满满呦!
还没有评论呢,快来抢沙发~