LLaMA-Factory训练DeepSeek修改自我认知

打印 上一主题 下一主题

主题 910|帖子 910|积分 2730

操作体系:Ubuntu24.04.2 LTS (Noble Numbat)

内存:16GB
GPU:NVIDIA GeForce GTX 1070 Ti  8G
2.可能使用的工具

问题排查网站:腾讯元宝 - 轻松工作 多点生存
连接服务器工具:Xterminal - 更好用的开辟工具,但不止于(SSH/控制台/More)
3.安装LLaMa-Factory的环境

使用 anaconda 创建用于 LLaMa-Factory 的虚拟环境
  1. conda create -n llama_factory python=3.11
  2. activate llama_factory
复制代码
(不会安装使用腾讯元宝 - 轻松工作 多点生存自己查安装教程)

4.下载llama_factory库

   git clone --depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd LLaMA-Factory
  conda create -n llama_factory python=3.11
  conda activate llama_factory
  pip install -e ".[torch,metrics]"
  # 如果下载的慢使用加快
  pip install -e ".[torch,metrics]" -i  https://pypi.tuna.tsinghua.edu.cn/simple
  测试是否成功
  1. llamafactory-cli version
复制代码

5.CUDA环境检查

cmd查看GPU版本:nvidia-smi


安装的torch默认为2.60,与我们本地的环境不适配,导致无法使用GPU(卸载已经安装的totch环境,切换符合CUDA版本的torch环境)或者重新装显卡驱动
对应版本参考链接:https://pytorch.org/get-started/previous-versions/
测试GPU

   import torch  
print(torch.cuda.is_available())  # 是否可以用gpu False不能,True可以  
print(torch.cuda.device_count())  # gpu数量, 0就是没有,1就是检测到了  

6.可视化微调启动

  1. llamafactory-cli webui
复制代码

7.魔塔社区DeepSeek模型下载

魔搭社区

在home目次下下载到model目次下
   modelscope download --model deepseek-ai/DeepSeek-R1-Distill-Qwen-1.5B README.md --local_dir ./model/
  

测试模型是否加载成功

1、目次填写你下载的目次点击加载模型,可以谈天说明加载成功

8、自我认知数据源预备

修改{{name}}为你自己要的名字

我是只保留了中文部分

加载数据预备训练


点击开始训练

测试模型


(重新测试新数据要卸载重新后再点击加载模型测试)



免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

大连密封材料

金牌会员
这个人很懒什么都没写!
快速回复 返回顶部 返回列表