论坛
潜水/灌水快乐,沉淀知识,认识更多同行。
ToB圈子
加入IT圈,遇到更多同好之人。
朋友圈
看朋友圈动态,了解ToB世界。
ToB门户
了解全球最新的ToB事件
博客
Blog
排行榜
Ranklist
文库
业界最专业的IT文库,上传资料也可以赚钱
下载
分享
Share
导读
Guide
相册
Album
记录
Doing
应用中心
搜索
本版
文章
帖子
ToB圈子
用户
免费入驻
产品入驻
解决方案入驻
公司入驻
案例入驻
登录
·
注册
账号登录
立即注册
找回密码
用户名
Email
自动登录
找回密码
密码
登录
立即注册
首页
找靠谱产品
找解决方案
找靠谱公司
找案例
找对的人
专家智库
悬赏任务
圈子
SAAS
qidao123.com技术社区-IT企服评测·应用市场
»
论坛
›
人工智能
›
人工智能
›
AIGC图像视频工具和网站大全:数十款图像、视频、音频天 ...
AIGC图像视频工具和网站大全:数十款图像、视频、音频天生软件和网站,总有 ...
tsx81428
论坛元老
|
2025-4-1 11:17:29
|
显示全部楼层
|
阅读模式
楼主
主题
1926
|
帖子
1926
|
积分
5780
作者公众号 大数据与AI杂谈 (TalkCheap),转载请标明出处
近期肝了很长时间,把国表里相对主流和常见的AIGC图像,视频,音频天生产品,网站都试用了一圈,做了一下总结,分享给大家。
主要是对各类产品功能做简单的介绍和展示,不涉及详细的深入探讨,针对此中部分优秀的产品,软件的功能和使用技巧,创作范例,后续会单独撰文介绍。
内容太多,一篇写不下,这一篇内容主要介绍各类图像天生网站和工具,谈一下个人的感受和看法,简单罗列一下优缺点和费用代价等等。下一篇会介绍视频和音频,音乐相关天生工具。
以下是本文图像篇中的主要产品列表:
国外产品
MidJourney
ideogram
DALL-E
国内产品
通义万象
通义千问
手机版通义 APP
豆包
即梦 AI
百度文心一言,文心一格,超能画布等
本地摆设产品
Stable Diffusion WebUI
ComfyUI
Foooocus
SD 模子体系云端服务相关产品
LibLibArt
TusiArt
RunDiffusion
其它AI创业公司或图片视频领域商业公司的产品
可灵,智谱,whee,viva等
然后是详细每个产品的简单介绍,假如不想看介绍,只想看一下各自的优缺点小结,可以直接跳到文章最后边的总结部分。
MidJourney
网址:https://www.midjourney.com/home
这两年以来,MidJourney一直是AIGC图像天生领域的商业网站标杆,有浩繁的付费商业用户,功能迭代创新和图像天生质量等方面一直走在行业前列。近期才有一些其它商业网站和开源产品开始逼近MJ的水平。
之前必要在discord上使用,必要注册discord账号(用google邮箱账号之类的也可以登录),通过下令行指令,输入相关文本描述进行绘图。假如简单试一下,不想装discord APP,也可以通过discord的网页版:https://discord.com/channels/662267976984297473/ 来使用MidJourney的服务。
不过,如今,你也可以直接MidJourney官网网页上来创建图像了,虽然云云,照旧有许多老用户习惯在discord上使用。
优点:
非常好的图像天生质量,画质效果在第一梯队,被浩繁AI创意工作者使用
不必要复杂的提示词就能有很好的效果,持续添加各种新的功能
使用CRef之类的参数,在画图时可以获得较好的人物一致性控制本领
缺点:
非付费用户注册以后的信用点额度用完以后,后续没有每日免费额度,无法继承使用
费用:
想要畅快的使用的话,至少必要购买30刀一个月的标准筹划才行
ideogram
网址:https://ideogram.ai/
虽然MidJourney是行业领头羊,但这个网站我个人会更加保举,主要是因为它的模子天生的图片,我感觉在美学构图,色彩等方面,遥遥领先,任意写一点描述词,天生写实风格的图片都有很强的艺术效果,几乎不消后期处理惩罚。毕竟定位也是针对计划师群体的。
下面这些都是我任意画的,没有参考任何其它人的作品,就是简单写了一些提示语。
最新的2.0模子,更新以后,画文字的效果异常的好(假如认识AI作图的用户,应该知道画文字是老大难题目),比Flux还强许多,以致能把文字融入各种造型计划中,进行艺术化的抽象和变形,分列结构等等,以是也有许多用户用它来计划海报,PPT,LOGO等等。
比如下面这两张(不是我画的)都是通过纯文字描述直接文生图画出来的,放在其它文生图模子,几乎是不可能完成的任务。
再比如计划一张电影海报,文字和画面的联合:
《最后之光》电影海报。背景颜色黑暗且荒凉,充满后末日氛围。主要画面是一片有着废墟修建、废弃车辆和散落物品的荒地。焦点是一位身着黑红相间婚纱的年轻女子,站在废墟之上,面部细节丰富,长发飘飘。标语是 “在这片荒芜之地,生存是唯一的信奉”。一个辐射告诫标记被放置在海报的一个角落。利用烟雾和尘埃效果营造出后末日氛围。通过透视和景深使背景更加遥远和荒凉。
比如:核战后的世界尽显荒凉,粉赤色的迷雾弥漫,厚厚的冰雪覆盖在狂野上,远处是冰封的堡垒,一个身穿红黑色蕾丝晚礼服的优雅的中国年轻密斯,站在坠毁的半截飞机边上,望着远方,风吹过漂亮的脸庞,天涯巨大的红玉轮,一个破败的箱子,边上放着一个破旧的电视,箱子上写着“绝密,请勿开启”
优点:
艺术审美遥遥领先!出图可用率很高,图像遵循文字的准确率很高,描述词得当的话,几乎每张图都可用
使用magic prompt功能的话,能使用非英文输入(固然就包罗可以使用中文)(不过,这也是许多网站的标配了),会主动扩充优化提示词,转成英文,天生四张,每张的提示词还会主动有些变革,让天生的图像之间的变革更丰富一些。固然,这也会导致部分提示词被去除,不严格遵守用户输入,这个选项可选。
非常良心的是,免费用户下载图片也没有加水印(真的追求美学效果啊),只是限定了只能下载压缩率很高的jpg图,不能下载PNG图
缺点:
免费用户几乎干不了任何后期工作,比如放大,导出无损图片,图片局部重绘等等 (但是,因为出图效果很好,也已经够用了)
人物一致性方面的控制本领还没有(相比MJ)
不是Plus以上的用户的话,不能管理删除过往天生的图片(比如效果不好的),图片多了会比力难找估计。
费用:
一天10个信用点的免费额度,2.0模子可以天生5次共20张图,我几乎都是在别的网站画几张,确定好大概的提示词以后,再到这个网站上画一遍,总是有意外的惊喜
可以或许惬意的畅用的PLUS筹划20刀,比MJ自制10刀
DALL-E
DALL-E也是比力知名的绘图模子,假如不通过API,而是网站的话,它主要通过ChatGPT 大概 Bing的对话界面来使用
优点:
图像质量照旧不错的(不过相比如今浩繁专门定位于文生图,图生图的网站产品,出图效果方面并没有太突出的地方)
缺点:
由于透出形式是问答式对话,也没有太多的图像针对性参数设置功能,只提供非常根本的文生图本领。不太能满足必要精确控制图像天生的需求场合
费用:
以透过ChatGPT使用为例,假如不付费,每天只有非常少量几张图的免费额度。
接下来看一下国内的产品
通义万象
吴妈回归阿里掌权以来,阿里来一直在喊ALL-in AI,通义大模子家族也是对应的产物之一,万象是通义大模子的画图部分
https://tongyi.aliyun.com/wanxiang/
不过,其效果一般,天生图像的变革相对较少,且具有一定的 AI 感。固然,最新的 2.0 模子相比刚开始的 1.0 模子已有不少改进。
优点:
网页版每天有约莫 50 张免费额度可用;若额度不够,可使用手机 APP 版,该版本无额度限定。
小白上手比力简单,界面还比力简单,有各种可视化的参考选项
灵感扩写等能把简单的提示语扩充描写,方便词穷的同学(不过这也根本是各类AI生图网站的标配了)
缺点:
图像的后期调整,修改等本领相对弱一点
对一些名人的画像好像做了隐私控制?比如下面这张画赫本,就完全不像。各种提示词检查做得比力严。
各种敏感词检测也很严格,比如邻近万圣节了,你要画个骷髅,吸血鬼,僵尸,鬼魂,十字架什么的,这些统统都不可,都是被禁的关键字。
费用:有钱任性,都没有给你个人用户交钱的地方。。。
通义千问
https://tongyi.aliyun.com/qianwen/
千问是大语言模子,但是也能调用绘图模子画图,万象必要灵感点数画图,假如你不想装APP,就是想要用网页版画图的话,也可以在通义千问里面画图,
优点:
免费账号也没有额度数量限定。
缺点:
图像效果差一些,估计和万象使用的模子版本不一样
别的问答式的画图,功能也相对简单,缺乏后期调整本领
费用:无
手机版通义APP
手机版AI智能助手APP,大概是大厂们都想要争夺的下一个用户流量入口,通义APP里面塞了许多AI相关的功能,从语言模子,视频模子,还有各种七零八落的虚拟人物抽卡,AI角色等功能,图像天生功能只是此中的一个模块。
总体感觉产品形态交互计划比力差,人性化的计划不足,手机版APP的各种功能就是混乱的塞在一起,但模子相关技能水平照旧比力高的。里面有一些其它有趣的功能模块,以后也可以介绍
效果和网页版一样,背景都是相同的模子,2.0专业版的模子稍微好一点,但不多。出图的多样性也稍微欠缺一些。
除了不限额度以外,优缺点和费用,雷同网页版。
豆包
说完阿里系的,说字节系的,直接的豆包也是定位雷同通义如许的AI工具集成网站,AI画图功能也只是此中的一个模块。
网址:www.doubao.com
漫画风格
画赫本像许多,应该是没有刻意去控制名人肖像,内容检察得要松一些。
豆包同样有APP版和windows客户端版本,三端的交互内容和对话记录都是互通可见的,这就非常好。
优点:
用户交互的细节,易用性做得比通义强太多了。
网站版也是不限量使用的,不像通义只有APP版不限量。
速度非常快,根本没有排队的感觉,扩图和局部重绘的速度也很快
有些风格模版天生图像的真实感不错,比如胶片风格的照片
一些画面内容要求复杂的图片,也能较好的遵循提示词给出根本满足所要求的元素内容,指令遵循性还不错
比如:万圣节夜幕下,一位十八世纪女孩身着哥特风华服,黑色小皮鞋,脸部特写。坐在一只巨大的黑白色猫身边。红黑蓝白粉色蕾丝长裙。她头戴一顶小礼帽,帽子上有一根孔雀羽毛,帽檐下,惨白面貌面貌被一抹粉赤色的唇膏衬托得更加神秘莫测。玫瑰花装饰,动态的姿势,烟熏眼妆,诡异的微笑,脸部特写。背景中,巨大的暗赤色玉轮,月光洒在古老城堡上,营造出一种惊悚而神秘的氛围。虚化的背景光斑。图片风格为电影写真,比例 4:3
缺点:
功能比力有限,图片的放大,细节重绘之类的功能都没有(固然通义也没有)
图片的分辨率也比力小,简化了部分图像编辑和调整的功能。
人物姿势非通例大概画面结构复杂时,照旧容易出现手脚画面的崩坏(固然泰半产品都如许,只有少数能做到根本不崩)
功能简单和豆包的定位办公相关领域有一定关系。实际上字节系有别的一款专注于图像和视频天生领域的产品,这方面的功能就完整强盛许多,就是我们下面要说的即梦AI。
费用:无
即梦AI
网址 https://jimeng.jianying.com/ai-tool/home
即梦AI通常被大家用来做视频,但它的图片天生本领也很强,特殊是导入参考图的本领(应该根本上是Controlnet的本领),可以提供很强的图像内容控制本领。
此外最新的画板功能提供了大量的图像精确控制修改的本领,常见的如局部重绘,细节改进等等。最有特色的是图像局部转向本领,根本上是参考局部图像,按照箭头方向重构画面,但保持图像特征的相似性。比如下面这个例子,我把三个脸都做了不同方向的转向,效果惊人。(这有什么用呢?比如可以作为视频头尾帧的天生,把前后两张图片喂给视频天生模子,天生运动视频效果)
优点:
丰富的图像后处理惩罚调整功能,可以反复细化和重绘一张图片的细节,提高了抽图的可用性。
几乎完整的Controlnet图像控制本领,一定程度上满足自定义控制画面内容的必要
UI交互计划公道,用户体验较好
缺点:
严格来说不算缺点,是希望提高的地方:
各个不同的模子目前支持的图像控制本领不一样,本领有些缺失
没有内置自定义角色的本领,人物形象控制必要别的想办法(比如使用它的Controlnet)
文生图,人物外貌形象特征等,多样性稍微不足,略显单一
费用:
不像豆包,即梦的免费账号不是无限量使用的,每天有66个积分,通常画一幅图是1-2个积分。但是即梦的画图功能,高清图和细节重绘都是不消耗积分的,以是可以多次反复重绘一张图的细节,一定程度上替代了部分抽卡,以是照旧比力耐用的。固然,假如要畅快的使用,照旧要开会员,积分实在从一个月来看,没有增长多少,但最主要是去水印和视频的高清功能。
百度(文心一言,文心一格,超能画布等)
文心一言
文心一言中可以使用文生图的功能,我以为效果一般,而且必要百度账号实名身份证认证才气使用。
文生图和图生图都是通过文心一言的大语言交互模子的界面来完成的
图生图也是通干涉答的方式,上传图片,描写要求,不会写,可以让它本身扩写。
怎么说呢,语言明白本领还可以,但天生图像的质量清晰度很差
因为没有提供任何修改手段,可以尝试通干涉答形式要求他把图像画得高清一些。画质倒是很多多少了,但效果和原图已经是大相径庭的两张图了。
优点:免费,不限额度
缺点:必要身份证明名认证的百度账号,功能比力简单单一。
费用:无
文心一格
相比文心一言,文心一格是纯定位图像天生领域的产品。
https://yige.baidu.com/
我用的很少,起首没有什么免费额度,其次效果很一般,没有什么特殊的地方,出图还常常崩,以是就简单看了一下,试用完几张新用户的额度就完事了。
超能画布
百度照片里面还有一个功能叫百度超能画布,这个不必要实名认证,主打的是各种图片AI后期改造和加工处理惩罚。这个定位和百度照片倒是比力匹配。
https://photo.baidu.com/photasy/home
比如上传的是左图,选择一个模版,天生右图。功能有点简单,但效果还可以。不过,应该很少人会为了这些功能开会员付费吧。有雷同需求的用户,可能都去买美图秀秀之类的会员了,同样有雷同的功能。
假如你有一定的动手本领,想要更加自由的,免费的产品,那么可以试一下本地摆设各类开源图像模子工具
Stable Diffusion WebUI
Stable Diffusion 模子,简称SD,是和MidJourney,DALL-E等商业产品齐名的开源图像大模子,有许多种方式可以在本地摆设运行相关模子。
而 SD WebUI则是一个图形化的UI交互封装,可以通过它使用SD以及其它各类图像大模子。生图的效果取决于你选择的模子和插件
有一定动手本领的小伙伴,可以去SD WebUI的github仓库下载并自行安装使用
https://github.com/AUTOMATIC1111/stable-diffusion-webui
但安装过程要下载大量的依赖包,还必要配置各类运行环境和参数等等,以是大多数时候,照旧直接下载别人打包整合软件包会更快更便利一些。比力出名的比如国内秋叶大佬出品的整合包
详细下载地址,B站上任意搜刮一下就有了。
使用整合包最大的便利是所有的依赖环境,以及后续的更新,都有可视化的界面,根本可以一键完成。假如不鉴戒搞坏了,在下载一个也很容易,无痛使用。一些国外的资源地址,还做了国内镜像,就很方便,以是整合包能用就用,大多数时候没必要本身折腾。
详细的使用方式,固然是要比现成的网站文生图或图生图网站产品要复杂的,但实在只要试一下,大概简单看个讲授视频,也都能快速上手。最根本的就是选个模子,填一下描述词,选择天生的采样方法,步数,然后点击天生。
根据你装的插件多少,你可以使用各种额外的功能,如人体3D骨架编辑,模子训练,标签反推,各种高清修复,扩图脚本等等。这些就不是一两句话可以讲清晰的了。
固然,你必要一张显卡来使用这个软件。假如不训练模子,实在不消太高级的显卡,主要是对显存大小有要求,4-8G就可以跑包罗SDXL在内的浩繁模子了,而16G显存,比如4060TI的16G版本,就可以跑最新的Flux模子,无非比4090之类的慢一些罢了。固然,假如要追求速度或使用各种插件,大概训练本身的模子的话,显存照旧越大越好。
各类模子资源可以去比如 huggingface 大概 civitai下载
优点:
使用方式自由,开源模子和各类插件浩繁,有很强的可控性。
有大量的社区资源,可折腾性强。
利用界面相对来说照旧比力简单的(相比本身编程跑模子代码,大概背面要介绍的ComfyUI)
缺点:
基础模子出图质量没有一线成熟商业产品好(固然,也有补偿的方式,包罗使用各种Lora,Controlnet之类),
显卡不够好的话,出图速度和出图的大小受限
有一定的学习成本,越想玩得溜,越必要投入时间在研究工具本身的使用和拓展上。
必要本身跟进新的模子,使用技巧等等。(固然,对喜欢专研的人来说,这说不定是优点。。。)
费用:
假如你没有富足好的显卡的话,你必要一张显卡作为一次性投资
ComfyUI
ComfyUI 是一个基于工作流(workflow)的UI交互构建和天生图像(实在不光是图像,可以是任何流程)的软件体系,用户通过连接不同的节点来构建复杂的图像处理惩罚和天生流程。
一个详细的工作流由多个节点构成,每个节点代表不同的利用和功能,如模子加载、噪声应用、图像天生等。这些节点通过输入输出端口,连接在一起,形成一个流程图,描述了图像从原始数据到最终输出的处理惩罚过程。
认识编程的小伙伴,可以把它明白为一个个的函数模块,你负责串联调用这些函数。实际上有许多知名的软件也采用这种工作流流程图的交互形式。比如3D建模软件Blender
下面是一个最简单的官方例子,最基础的文生图工作流
同SD雷同,有一定动手本领的小伙伴,可以去ComfyUI的github仓库下载并安装使用
https://github.com/comfyanonymous/ComfyUI
但同样的,直接下载别人打包整合的软件包会更便利一些。秋叶大佬也有封装了雷同启动界面的整合包,可以管理各类扩展安装。
但ComfyUI启动完的网页界面里,本身也提供了完善的环境管理功能,具备更强的功能
比如节点管理
假如不会构建工作流的话,资助文档里有大量的使用各种不同节点和实现不同功能的示例工作流,社区也有大量的工作流可以参考,还有人替别人付费定制特定功能的工作流。
工作流通常是一个json文件大概包罗了工作流Json信息的图片,直接拖进ComfyUI的界面就可打开别人构建好的工作流,假如有缺失的节点,可以在管理界面一键补充安装。
工作流可简可繁,稍微添加一些功能,可能流程图就会变得比力复杂
至于一些功能强盛,流程复杂的工作流,往往必要数量巨大的节点进行构建。
优点:
高度定制化的本领,ComfyUI及其社区提供了大量不同功能的节点,你可以根据本身的需求,自由组合使用这些节点。
工作流导入导出非常便利,便于分享,可以学习和借鉴他人的工作流创意和经验。可以几乎完美复制特定图像天生和工作流程
相比ComfyUI,节点自定义,可以或许按需加载功能,除了机动以外,通常也更节流显存,同样的配置下,偶然可以或许运行更大的模子和更复杂的流程。
往往可以或许最快使用上最新的模子大概工具。比如用Flux画两张《2046之水下巴黎》,看看广角人像和文字控制的效果
再画两张近期流行的猫猫守护神照片,看看这种反常尺寸画像的指令遵循本领
缺点:
与一些界面简洁、利用直观的图像天生软件相比,ComfyUI 的界面可能看起来较为复杂和混乱,不容易快速上手
明白和把握节点体系的工作方式以及各节点的功能和参数必要泯灭大量时间和精力。必要学习如何正确连接和配置这些节点,才气实现盼望的图像天生效果
FOOOOCUS
假如上面SDWEBUI还嫌贫困,想和生图类网站产品一样简单傻瓜的界面,可以试一下 foooocus这个软件,不过我个人没有以为太有必要,除非你是完全新手小白,。
https://github.com/lllyasviel/Fooocus
SD模子体系,云端服务相关产品
假如想享用SDWebUI大概ComfyUI的高度自由性,但是又不想本身在本地搭建环境,又大概没有富足好的显卡。那也可以使用一些云端在线的摆设服务。
这些网站,大多数通常会提供在线版本,配置好的基于各类开源模子的绘图界面,也可以提供SDWebUI,ComfyUI,Foooocus之类开源软件的云端摆设服务,打包根本的环境,同时可以本身上传额外的模子,文件之类。通常他们也会建设一些社区让用户分享各类模子,图片,工作流等等。大同小异,选一个代价合适,大概眼顺的就好了。
常见的,国内比如
LibLibArt
:https://www.liblib.art/
TusiArt
:https://tusiart.com/
国外比如
RunDiffusion
:https://rundiffusion.com/
优点:不消本身摆设,成果方便分享,随开随用。
缺点:要花钱呗。管理文件,后期处理惩罚这些不如本地可以联合各种工具来的方便
费用:各不一样,比如LibLibAI如下,假如短期简单使用,大概偶然训练个模子必要好的显卡,照旧比本身买显卡要节流一些的,看本身实际必要了。
其它AI创业公司,团队的产品
还有许多国表里AI创业公司,大概国内雷同快手,美图如许的公司有图像天生类产品,下面列举一些,他们此中有不少产品,图像天生这块的功能,实在照旧可以的,但因为没有特殊突出的地方,大概他们的产品,相对知名的部分是其视频天生的部分,以是对其图像天生部分只做简单地罗列,大家可以本身去试一下。
可灵AI
https://klingai.kuaishou.com/text-to-image
可灵AI以图生视频功能出名,图像天生部分,外貌上看只提供文生图功能,但是可以拖进参考图,虽然不能指定控制逻辑,只能控制参考强度,但是一定程度上是图生图的功能
智谱-清言
https://chatglm.cn/
之前主要是chatglm大语言模子产品,厥后做的图像天生产品。以是文生图模子是以对话的形式提供的。图像效果,看运气。
whee
美图的AI绘图产品 https://www.whee.com/
viva
https://vivago.ai/
特色功能是提供了角色创建和绘图时引用角色的功能,有助于天生人物外貌一致性的图像。
提供了大量的分类辅助提示词(通过他的TAG功能使用),也有图像参考功能。图像天生,构图还可以,但是颜色总感觉过度AI了,有很强的涂抹和过饱和的感觉。
不过,他的免费账号是不限量天生图片的,只是部分功能受限,以及下载带水印。要去水印的话,5刀的订阅筹划就可以了,也是比力良心了。
小结
本文主要介绍了文生图、图生图相关的国表里产品,包罗商业网站、国内大厂产品、开源图像模子工具、云端服务相关产品以及其他 AI 创业公司的产品:
国外网站产品
MidJourney:
网址:https://www.midjourney.com/home
是 AIGC 图像天生领域的商业标杆,功能迭代创新和图像天生质量高,需付费使用,非付费用户信用点额度用完后无免费额度。可在 discord 或官网网页上使用,有较好的人物一致性控制本领。
ideogram:
网址:https://ideogram.ai
天生的图片美学构图、色彩领先,2.0 模子画文字效果好,可计划海报等。免费用户下载无水印但有功能限定,有一定的艺术审美优势。
DALL-E:
通过 ChatGPT 或 Bing 的对话界面使用,图像质量不错但出图效果在专业文生图产品中不突出,缺乏图像针对性参数设置功能。免费额度少。
国内产品
通义万象:
网址:https://tongyi.aliyun.com/wanxiang
阿里通义大模子的画图部分,网页版每天有 50 张左右免费额度,APP 版无额度限定。小白上手简单,有灵感扩写等功能,但图像后期调整本领较弱,对敏感词检测严格。
通义千问:
网址:https://tongyi.aliyun.com/qianwen
大语言模子,可调用绘图模子画图,免费账号无额度限定,但图像效果差,功能相对简单。
手机版通义 APP:
功能混乱但技能水平高,效果与网页版雷同,出图多样性欠缺,除不限额度外优缺点与网页版相同。
豆包:
网址:www.doubao.com
用户交互细节好,速度快,不限量使用,一些风格模版真实感不错,指令遵循性好,但功能有限,画面复杂时易出现人物手脚细节崩坏。
即梦 AI:
网址:https://jimeng.jianying.com/ai-tool/home
图片天生本领强,有丰富的后处理惩罚调整功能和图像控制本领,UI 交互计划公道,但免费账号有使用限定,人物外貌形象特征多样性不足。
文心一言:
可文生图,需百度账号实名身份证认证,免费不限额度,功能简单单一,图像质量清晰度差。
文心一格:
纯图像天生产品,无免费额度,效果一般,出图易崩。
超能画布:
百度照片中的功能,主打图片 AI 后期改造和加工处理惩罚,无需实名认证,功能简单但效果可以。
开源图像模子工具
Stable Diffusion WebUI:
图形化 UI 交互封装,可使用 SD 及其他图像大模子,生图效果取决于模子和插件,使用有一定学习成本,必要显卡,有大量社区资源。
ComfyUI:
基于工作流的图像天生软件,高度定制化,可导入导出工作流,学习成本高,界面复杂。
FOOOOCUS:
SD 模子体系,界面简单傻瓜,适合新手小白。
SD 模子体系云端服务相关产品
LibLibArt、TusiArt、RunDiffusion 等,不消本身摆设,成果方便分享,管理文件和后期处理惩罚不如本地方便。
其他 AI 创业公司产品
可灵 AI、智谱 - 清言、whee、viva 等产品,图像天生功能各有特点,但没有特殊突出之处
保举
最后,这么多产品,假如你看得眼花缭乱,非要简单保举几个的话,那么:
商业付费产品,对审美和计划要求高:保举ideogram,对功能要求强:保举MidJourney,要使用国内产品,即梦AI也可以考虑,综合性价比高。
非重度使用,不想付费:豆包,通义万象APP 都能免费画图,玩得好的话,效果也不错
有显卡,想要本地摆设大概不想上传图片担心个人隐私:新手小白,保举使用Stable Diffusion WebUI整合包, 有一定技能明白本领,追求高效和完全的自由,保举使用ComfyUI。
有技能,没显卡,大概工作负载高,那么LibLibArt等找一个顺眼的在线模子服务就好
固然,这些选项也不辩论,作为成年人,你也可以全都要。。。
免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
本帖子中包含更多资源
您需要
登录
才可以下载或查看,没有账号?
立即注册
x
回复
使用道具
举报
0 个回复
倒序浏览
返回列表
快速回复
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
or
立即注册
本版积分规则
发表回复
回帖并转播
回帖后跳转到最后一页
发新帖
回复
tsx81428
论坛元老
这个人很懒什么都没写!
楼主热帖
【pandas小技巧】--读取多个文件 ...
【参考】开发工程师职级与职级界定-职 ...
MySQL与Redis数据双写一致性工程落地案 ...
【毕业季】纸短情长,浅谈大二以前的学 ...
读SQL进阶教程笔记06_外连接
mysql修改表字段长度
kubernetes之镜像拉取策略ImagePullSec ...
BinaryBombs(二进制炸弹实验) ...
Apache Shiro反序列化漏洞(Shiro550) ...
手把手教你定位线上MySQL锁超时问题, ...
标签云
渠道
国产数据库
集成商
AI
运维
CIO
存储
服务器
浏览过的版块
Mysql
linux
快速回复
返回顶部
返回列表