Win10微调大语言模型ChatGLM2-6B

慢吞云雾缓吐愁 · 2025-1-11 13:58:54

在《Win10本地部署大语言模型ChatGLM2-6B-CSDN博客》基础上进行，官方文档在这里，参考了这篇文章
首先确保ChatGLM2-6B下的有ptuning

AdvertiseGen下载地点1，地点2，文件中数据留几行

模型文件下载地点（注意：ChatGLM2-6B对话用到的的模型文件不能简朴的用到这里，bin文件可以复用，但其他文件一定要重新下载，否则要报一些错)

anaconda prompt中运行，进行假造环境

复制代码

运行微调除 ChatGLM2-6B 的依赖之外，还需要安装以下依赖

复制代码

先相识一下train.sh(仅在Linux中利用)内里各行的意义

复制代码

Windows下用以下的train.bat
因我的电脑显存只有8G，故将per_device_train_batch_size改为8
去掉--quantization_bit 4

set PRE_SEQ_LEN=128
set LR=1e-4
python main.py ^
--do_train ^
--train_file AdvertiseGen/train.json ^
--validation_file AdvertiseGen/dev.json ^
--preprocessing_num_workers 10 ^
--prompt_column content ^
--response_column summary ^
--overwrite_cache ^
--model_name_or_path D:\\openai.wiki\\ChatGLM2-6B\\ptuning\\THUDM\\chatglm2-6b ^
--output_dir D:/openai.wiki/ChatGLM2-6B/ptuning/output ^
--overwrite_output_dir ^
--max_source_length 64 ^
--max_target_length 128 ^
--per_device_train_batch_size 8 ^# batch_size 训练批次根据显存调节
--per_device_eval_batch_size 1 ^
--gradient_accumulation_steps 16 ^
--predict_with_generate ^
--max_steps 3000 ^
--logging_steps 10 ^
--save_steps 1000 ^
--learning_rate %LR% ^
--pre_seq_len %PRE_SEQ_LEN%

复制代码

进入ptuning文件夹

复制代码

运行train.bat，即可开始训练（有问题的话继承今后看）

复制代码

可能碰到的几个问题

TypeError: JsonConfig.init() got an unexpected keyword argument 'use_auth_token’
办理方式

复制代码

name ‘round_up‘ is not defined
办理方式
将train.bat中的–quantization_bit 4删除
或者pip install cpm_kernels

AttributeError: ‘ChatGLMModel‘ object has no attribute ‘prefix_encoder‘
办理方式
https://huggingface.co/THUDM/chatglm2-6b/tree/main
下载除bin文件以外的最新文件

免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！更多信息从访问主页：qidao123.com:ToB企服之家，中国第一个企服评测及商务社交产业平台。

		自动登录	找回密码
密码			立即注册

0 个回复