qidao123.com技术社区-IT企服评测·应用市场

标题: DeepSeek模型微调:使用unsloth微调框架对DeepSeek-R1-Distill-Llama-8B模 [打印本页]

作者: 耶耶耶耶耶    时间: 2025-2-28 07:46
标题: DeepSeek模型微调:使用unsloth微调框架对DeepSeek-R1-Distill-Llama-8B模
本文介绍了使用unsloth微调框架对DeepSeek-R1-Distill-Llama-8B模型进行微调,实现将SQL语句转换为自然语言描述。主要步调包括:
1️⃣在Colab设置运行情况,安装必要的库和包
2️⃣预备和处理惩罚huggingface上的数据集
3️⃣设置微调的超参数,启动微调过程
4️⃣测试微调后模型的性能,生存并上传微调的模型
  
1️⃣ Colab情况设置与依赖安装

核心步调:

2️⃣ 数据集预备与预处理惩罚

关键要点:

3️⃣ 模型加载与微调参数设置

优化设置:

4️⃣ 启动微调与训练监控

执行流程:

5️⃣ 模型测试与部署

验证与导出:

优化发起与常见问题



links:
https://www.bilibili.com/video/BV1pCNaeaEEJ

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。




欢迎光临 qidao123.com技术社区-IT企服评测·应用市场 (https://dis.qidao123.com/) Powered by Discuz! X3.4