论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
应用中心
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
qidao123.com技术社区-IT企服评测·应用市场
»
论坛
›
人工智能
›
人工智能
›
Datawhale AI 夏令营 第四期 AIGC Task1
Datawhale AI 夏令营 第四期 AIGC Task1
王國慶
论坛元老
|
2024-9-11 09:07:09
|
显示全部楼层
|
阅读模式
楼主
主题
1989
|
帖子
1989
|
积分
5971
运动简介
运动链接:Datawhale AI 夏令营(第四期)
以及AIGC里面的本次任务说明:Task 1 从零入门AI生图原理&实践
链接里的教程非常详细,很适合小白上手,从利用服务器平台到配置环境再到跑模型,手把手教!
具体细节我就不赘述了,参看教程即可,下面我告急就此次Task1任务学到了哪些内容作一个总结。
个人总结
底子知识
我开始接触图像天生呢,就是在进入2020年代后,大规模预训练模型时代。虽然是在这时间开始接触图像天生的,但并没有利用大模型,毕竟是小白嘛,就从经典的深度学习方法开始学习,如CNN和GAN。至于更早的规则和模板匹配的方法、统计模型和呆板学习技术,我就没有细看了。
这次任务呢,告急是针对大模型方法,以Stable Diffusion系列为底子模型,用LoRA方法微调以训练人物天生模型来实现文生图。
Stable Diffusion
好像是22年的吧(我也记不太清了),反正它很火,我没关注但是听说了。好像是原先在二维图像上的扩散太复杂速度太慢于是映射到一维的隐式空间中扩散,还加入了留意力机制(我任意说说,不一定对)。
LoRa
这个我就在第一次接触大模型的时间用过,接触的都是大语言模型。当时是ChatGPT出来的第二年,各种大模型争先恐后百花齐放,作为先锋的就是几个著名机构和名校,什么百度阿里华为啊,中科院啊,复旦啊,清华的ChatGLM啊,当时是在微调这些预训练模型的时间用过LoRa方法微调(虽然我也不懂原理,就是跟着步调走的)。
提示词
当时我在微调大语言模型的时间就有研究过这个,当时还衍生出了一种新行业叫“prompt工程师”嘛,告急就是如何设计question的格式来让模型的answer更准确,一般来说是针对特定范畴来设计特定的prompt。
参考图控制应该就是下面这个文生图微调框架中的可选部分吧,这个我还头一次见到。
实践感受
前面部分学习魔搭(虽然我比较喜欢叫魔塔)社区和阿里云平台的一个联动挺不错的,毕竟如今假如自己硬件资源不够的话可以利用人家的云服务器来跑模型,这次学习可以帮助自己熟悉这种平台的利用(根本都是用Notebook和命令行的,与本地的PyCharm不一样)。
接下来是报名了一个赛事,此次夏令营呢,是以教各人完成这项赛事的方式来教我们微调模型的。这挺不错的,毕竟这个比赛是天池的嘛,恰好借此可以相识天池。这方面再一个比较着名的比赛就是kaggle了,好像含金量更高,可以自行去相识(有感兴趣的也可以和我探讨)。
平台的利用没什么可说的,下面就开始真刀真枪地在平台上实操啦~
整个模型微调流程的话就是一个很规范的流程。(而且我也就只熟悉流程了,具体每行代码做的事情我是没有研究。。)我看了它的文件,数据的话应该是拿动漫风格的图像来微调吧,然后模型好像是Kolors(具体我也不清楚它是不是Stable Diffusion系列的)。整个过程就是在Notebook中按照他给的顺序每一块代码运行一遍即可,没什么技巧。末了的话呢,就是用微调好的模型依次天生8张图片,然后拼在一起显示出来。这是默认天生的结果:
但是作为步伐员总想搞点事情,喜欢瞎琢磨。然后我就试了试,按照雷同的代码每次天生的图片都是一样的,这是为什么,能不能让它不一样。后来我发现只要改这个种子值就能不一样:
下面就是对应的两种雷同的提示词差别的结果:
碰到的问题
1.代码中“第一步:安装”之后的重启Notebook kernel总是不成功,也不是不成功吧,就是点了之后没反应,但好在不影响背面的操作流程。
2.其实也不算是问题,就是我在用差别的种子值将天生的差别图片生存到原先已有的路径中时,必须把原来检察的图片关掉再打开,才能显示新图片(这里我以为是新图片不能覆盖旧图片)。
好啦!本次学习条记就到这里啦,表述大概不是很专业,各人迁就看啦~
等待下一次学习任务呢!
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
王國慶
论坛元老
这个人很懒什么都没写!
楼主热帖
webman
不想打开 IDE 的摆烂一天
Jupyter Notebook,太强大了
React技巧之发出http请求
【网络】https单向认证和双向认证 ...
【Shashlik.EventBus】.NET 事件总线, ...
APP内存管理
Apache DolphinScheduler 3.0.0 正式版 ...
Bluecmsv1.6-代码审计
java如何显示"html转义字符"对应的原始 ...
标签云
渠道
国产数据库
集成商
AI
运维
CIO
存储
服务器
快速回复
返回顶部
返回列表