参 数名称 | 参数值 | 说明 |
pretrained_unet_path | models/kolors/Kolors/unet/diffusion_pytorch_model.safetensors | 指定预训练UNet模型的路径 |
pretrained_text_encoder_path | models/kolors/Kolors/text_encoder | 指定预训练文本编码器的路径 |
pretrained_fp16_vae_path | models/sdxl-vae-fp16-fix/diffusion_pytorch_model.safetensors | 指定预训练VAE模型的路径 |
lora_rank | 16 | 设置LoRA的秩(rank),影响模型的复杂度和性能 |
lora_alpha | 4 | 设置LoRA的alpha值,控制微调的强度 |
dataset_path | data/lora_dataset_processed | 指定用于训练的数据集路径 |
output_path | ./models | 指定训练完成后生存模型的路径 |
max_epochs | 1 | 设置最大训练轮数为1 |
center_crop | | 启用中央裁剪,用于图像预处理 |
use_gradient_checkpointing | | 启用梯度查抄点,节省显存 |
precision | "16-mixed" | 设置训练时的精度为混淆16位精度(half precision) |
泉源类型 | 推荐 |
公开的数据平台 | 魔搭社区内开放了近3000个数据集,涉及文本、图像、音频、视频和多模态等多种场景,左侧有标签栏帮助快速导览,大家可以看看有没有本身需要的数据集。 其他数据平台推荐:
|
使用API或爬虫获取 |
|
数据合成 | 使用现有的图形引擎(如Unity、Unreal Engine)或特定软件天生合成数据,这在训练某些类型的模型时非常有效。 近来Datawhale联合阿里云天池,做了一整套多模态大模型数据合成的学习,接待大家一起交流。从零入门多模态大模型数据合成 |
数据增强 | 对于较小的数据集,可以通过旋转、翻转、缩放、颜色变更等方式举行数据增强。 |
购买或定制 | 如果你的应用是特定领域的,好比医学影像、卫星图像等,发起从靠谱的渠道购买一些数据集。 |
欢迎光临 qidao123.com技术社区-IT企服评测·应用市场 (https://dis.qidao123.com/) | Powered by Discuz! X3.4 |