[论文笔记] llama-factory 微调qwen2.5、llama3踩坑

梦应逍遥 · 2024-12-13 22:11:08

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区。

您需要登录才可以下载或查看，没有账号？立即注册

x

一、bug

1、pre-tokenize的时候, 会OOM

解决：在yaml文件中添加streaming参数

# tokenize
streaming: True
max_steps: 10000

复制代码

https://github.com/hiyouga/LLaMA-Factory/blob/3a023bca2a502810a436cfba7708df164754ea62/src/llamafactory/hparams/data_args.py#L39-L41
   streaming: bool = field(
      default=False,
      metadata={"help": "Enable dataset streaming."},
   max_steps: 10000
<

免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！更多信息从访问主页：qidao123.com:ToB企服之家，中国第一个企服评测及商务社交产业平台。

		自动登录	找回密码
密码			立即注册

[论文笔记] llama-factory 微调qwen2.5、llama3踩坑

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区。

0 个回复

快速回复

楼主热帖

标签云

[论文笔记] llama-factory 微调qwen2.5、llama3踩坑

马上注册，结交更多好友，享用更多功能，让你轻松玩转社区。

0 个回复

快速回复

楼主热帖

标签云

登录参与点评抽奖加入IT实名职场社区