Stable Diffusion如何天生高质量的图-prompt写法介绍

[复制链接]
发表于 2025-4-27 09:17:50 | 显示全部楼层 |阅读模式
文章目录



  • Stable Diffusion
  • 使用


    • 尝试下结果
    • prompt的编写技巧


      • prompt 和 negative prompt
      • Prompt格式
      • Prompt规则细节
      • 优化
      • Guidance Scale


  • 总结
Stable Diffusion

Stable Diffusion是一个开源的图像天生AI体系,由Anthropic公司开发。它基于 Transformer模型架构,可以通过笔墨形貌天生高质量的图像。
Stable Diffusion的主要特点包括:


  • 强大的图像天生本领。它可以根据文本形貌天生非常传神的图像,包括人物、风景、动物等各种主题。
  • 对文本的明确本领强。它可以捕获文本形貌的关键信息,转换为视觉上的表现。
  • 天生图像分辨率高。它可以天生512x512甚至1024x1024像素的高分辨率图像。
  • 开源且易于使用。它创建在开源框架PyTorch等底子上,可以轻松地在GPU及平凡电脑上运行。
  • 训练数据量大。它的训练数据集包罗大量高质量图像,这是它强大本领的重要底子。
  • 结果多样化。每次输入相同提示,它都可以天生略有不同的结果,增加了结果的多样性。
  • 控制本领强。用户可以通过调整笔墨提示、超参数等方式控制天生结果。
Stable Diffusion是一种埋伏扩散模型(Latent Diffusion Model),可以或许从文本形貌中天生详细的图像。它还可以用于图像修复、图像绘制、文本到图像和图像到图像等任务。简单地说,我们只要给出想要的图片的笔墨形貌在提Stable Diffusion就能天生符合你要求的传神的图像。Stable Diffusion作为新兴的AI天生模型,拥有强大的图像天生本领,是现在最先辈的开源天生模型之一,值得关注。它的出现将推动创作界发生革命性的变化。
使用

尝试下结果

  1. prompt:beautiful girl,bikini,sea,beach,sunshine
复制代码
天生的结果如下:

结果不太好,我们来学习下prompt如何编写,再看看改善结果。
prompt的编写技巧

prompt 和 negative prompt


形貌语分为正向/负向形貌,它们也叫tag(标签)或prompt(提示词)
正面提示词:相比Midjourney,SD必要写得更精准和过细,形貌少就给AI更多自由发挥空间。
负面提示词:不想让SD天生的内容。
正向:masterpiece, best quality, 画质词,画面形貌。
反向:根据画面产出加不想出现的画面。
Prompt格式

第一段:画质tag,画风tag
第二段:画面主体,主体强调,主体细节概括(主体可以是人、事、物、景)画面焦点内容
第三段:画面场景细节,或人物细节,embedding tag。画面细节内容
第二段一样平常提供人数,人物主要特性,主要动作(一样平常置于人物之前),物体主要特性,主景或景色框架等
Prompt规则细节


  • 提示词的顺序决定了权重的大小,越靠前的词汇权重越大,会对图像天生产生更直接的影响。
  • 天生图片分辨率越大,必要的提示词量也越多,否则不同的提示词会产生不一致的结果,相互干扰。
  • 使用括号可以精确调整单个词的权重值,进步或低落其对图像天生的影响程度。常用的权重调整范围建议控制在0.25到1.5之间,避免超出这个范围带来负面结果。
    方法如下:
    (word) - 将权重进步 1.1 倍
    ((word)) - 将权重进步 1.21 倍(= 1.1 * 1.1)
    [word] - 将权重低落至原先的 90.91%
    (word:1.5) - 将权重进步 1.5 倍
    (word:0.25) - 将权重减少为原先的 25%
    请注意,权重值最好不要凌驾 1.5
优化

根据上面的规则我们来改下下prompt
  1. A beautiful young girl standing in the shallow seawater on a sunny tropical beach. She has long wavy blonde hair flowing in the ocean breeze. She's wearing a red floral bikini which compliments her tanned skin tone. Her fit athletic body is perfectly framed in this scene. She has a bright, energetic smile on her face as she's enjoying the warm ocean water washing over her feet. The background is a picturesque tropical beach scene with white sand, palm trees, and turquoise blue water sparkling in the bright sunlight stretching out to the horizon. This is a perfect summer beach day. The overall color tone is vibrant and cheerful. The girl looks natural, elegant, and carefree. This is a high quality, photorealistic image.
复制代码
报错
  1. “Unsafe content found”
复制代码
继承优化
  1. "A cheerful young woman smiling and having fun at the beach. She has long, dark brown hair blowing casually in the tropical breeze. She's dressed appropriately in a blue floral one-piece swimsuit. Posing happily on the shore, with one hand up to her forehead to shade her eyes. Behind her is a beautiful scenic view of bright turquoise waves gently lapping against the sandy shore. In the background, the wide open clear blue sky meets the ocean horizon. Palm trees and green vegetation dot the landscape. The sunlight is bright and warm. This is a high quality, idyllic summer beach scene."
复制代码
主要修改的点包括:

  • 使用积极正面词语 como “cheerful”,“having fun”,“happily”,移除可能引起歧义的词汇。
  • 将比基尼改为更保守的连体泳衣。
  • 去掉只形貌女孩的语句,加上与海滩景色的衔接。
  • 增加阳光、植被等平静自然的元素。
  • 使用专业的视觉形貌词语如“idyllic”,“scenic”等。
  • 强调图像质量要高,内容要正面积极。
  • 避免可能引起歧义或联想的表达。
看结果

很明显,改善很明显…… 哈哈哈哈哈哈哈 (假如被吓到着实不好意思,我也有点看恐怖片的感觉)
上面这些图是因为我Guidance Scale的参数设置太低了。
Guidance Scale

Stable Diffusion 模型中的 Guidance Scale 参数是调整文本提示(Text Prompt)对图像天生影响力的一个重要超参数。
Guidance Scale 参数的主要作用是:

  • 控制文本提示的重要性:


  • 参数值越高,文本提示的影响就越大,天生图片会越关注文本提示的要求。
  • 参数值越低,文本提示影响减弱,天生图片会更具原创性和多样性。

  • 均衡文本提示和训练数据:


  • 参数值越高,依赖文本提示的信息更多,训练数据的影响被压抑。
  • 参数值越低,训练数据的信息起主导作用,文本提示只起辅助影响。

  • 调节天生图片质量:


  • 得当的Guidance Scale可以资助天生更高质量的图片。
  • 参数过大或过小,都可能导致天生图片质量下降。
    通常Guidance Scale的取值范围在1-20之间。默认值是7,这是一个比较均衡的设置。使用时可以通过调整这个参数,来实现对天生图片的精细控制。
    Guidance Scale直接影响文本提示的作用强度,是Stable Diffusion中非常重要的一个天生控制超参数。
我们来调整下Guidance Scale参数

改后的结果如图(我着实不知道怎么修改CSDN才不违规了,一个连体泳衣都违规,其他平台都正常显示,只能马赛克了):

总结

想要用Stable Diffusion天生高质量的图片,避免天生低质量的“烂图片”,可以注意以下几点:

  • 使用公道的提示词(Prompt)


  • 提示词要简洁明确,避免歧义。important信息前置。
  • 添加符合的形貌词资助天生细节。如大小,颜色,质感等。
  • 使用正确的英文语法和拼写。
  • 避免使用负面和敏感词汇。

  • 调整超参数


  • 得当调高 Guidance Scale,增强提示词影响力。
  • 调整 Steps(迭代次数)不要过少,一样平常100-200。
  • 调试不同的 Sampler,如DDIM较平滑。

  • 使用高质量训练数据


  • 大型模型结果更好,如Stable Diffusion v2。
  • 尝试不同主题的训练数据,匹配天生目标。

  • 天生分辨率不要过低


  • 分辨率过低会造成图片质量下降。
  • 一样平常选择512x512 或更高分辨率。

  • 复核和选择图片


  • 天生多张样本图片,挑选结果最佳的。
  • 检查公道性,删除离题图像。
    通过以上方法,可以最大程度地避免Stable Diffusion天生不理想的低质量图片。但过程中也必要肯定的试错尝试,以找到最佳设置。
关于AI绘画技能储备

学好 AI绘画 岂论是就业照旧做副业赚钱都不错,但要学会 AI绘画 照旧要有一个学习规划。最后各人分享一份全套的 AI绘画 学习资料,给那些想学习 AI绘画 的小伙伴们一点资助!
感爱好的小伙伴,赠予全套AIGC学习资料和安装工具,包罗AI绘画、AI人工智能等前沿科技教程,模型插件,具体看下方。
必要的可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

一、AIGC所有方向的学习路线
AIGC所有方向的技能点做的整理,形成各个范畴的知识点汇总,它的用处就在于,你可以按照下面的知识点去找对应的学习资源,保证自己学得较为全面。


二、AIGC必备工具
工具都帮各人整理好了,安装就可直接上手!

三、最新AIGC学习条记
当我学到肯定底子,有自己的明确本领的时候,会去阅读一些先辈整理的书籍或者手写的条记资料,这些条记详细记载了他们对一些技能点的明确,这些明确是比较独到,可以学到不一样的思路。


四、AIGC视频教程合集
观看全面零底子学习视频,看视频学习是最快捷也是最有结果的方式,跟着视频中老师的思路,从底子到深入,照旧很轻易入门的。

五、实战案例
纸上得来终觉浅,要学会跟着视频一起敲,要动手实操,才气将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。

这份完整版的学习资料已经上传CSDN,朋友们假如必要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
继续阅读请点击广告

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

×
回复

使用道具 举报

×
登录参与点评抽奖,加入IT实名职场社区
去登录
快速回复 返回顶部 返回列表