张春 发表于 2024-11-23 04:43:10

Python酷玩之旅_aigc文生图模型入门(通义万相)

媒介

博主最近一直使用阿里的文生图模型(通义万相),天生一些图片。这个模型的用途,可通过阿里云官网的模型服务(MaaS),略窥一二:
   通义万相-文本天生图像是基于自研的Composer组合天生框架的AI绘画创作大模型,可以或许根据用户输入的笔墨内容,天生符合语义描述的多样化风格的图像。通过知识重组与可变维度扩散模型,加快收敛并提升最终天生。
假如你感兴趣,可直接通过官网(快捷方式)查看相关内容。
https://i-blog.csdnimg.cn/direct/99e157db60af4281a77dd30810a53b3d.png
接下来,我们直接快速的切入本文主题吧。
一、申请key

请参考博主的别的一篇文章基于Python的大模型学习手册(入门级)中的2.1.1节完成,这里不再赘述。
   提示:key是哀求模型的唯一的凭证,必要妥善保管,不能暴露在公网大概其他公共场所。
二、安装sdk

安装sdk也比较简单,输入:
pip3 install dashscope
执行完成后,可以通过Pycharm——>Python Packages查看是否已存在:
https://i-blog.csdnimg.cn/direct/68a0fa459f5345ba96d61dcad578b5b1.png
如上图,代表乐成。
三、选择模型

1. 文生图

本次选择的模型是wanx-v1。参数要求如下:
https://i-blog.csdnimg.cn/direct/44c301843818449fadda4305e4842bbf.png
2. 应用场景

它的应用场景,可通过官方资助文档获得。博主直接进行罗列,不再转述。
2.1 艺术与计划创作

计划师和创意工作者快速天生概念草图、插画、海报、包装计划、甚至数字艺术品,极大地缩短了构思到成品的时间,降低了创作门槛,文生图技术提供了无限的灵感源泉和高效的原型天生工具。
2.2 广告与营销物料天生

文生图可以或许即时响应广告文案,天生符合品牌调性、产物特性和营销策略的视觉内容,节流了传统拍摄与后期制作的成本,广告内容根据及时热门敏捷调整,实现高度定制化和敏捷营销。
2.3 教育与培训资源制作

教育工作者和培训师使用文生图模型来创建生动、直观的教学素材,有助于提升教学内容的吸引力和明白度,定制化的图像资源还能用于制作互动课件、电子教科书,丰富教育资源库。
2.4 新闻与媒体内容生产

新闻机构和内容平台采用文生图技术来加强报道的视觉呈现,即时天生的视觉内容不仅能吸引读者注意力,进步阅读体验,还能确保新闻报道的时效性和精确性。
2.5 游戏与娱乐内容开辟

游戏开辟者借助文生图大模型来快速天生游戏内的角色、道具、环境元素等美术资源,用于动态天生游戏NPC(非玩家角色)外貌或定制化的玩家角色,增长游戏天下的多样性和沉浸感。
2.6 室内计划与家居装饰

室内计划师和家居平台使用文生图模型为客户提供假造计划方案,可天生相应的空间布局、色彩搭配及装饰细节的三维视图或渲染图,便于计划师快速迭代修改。
2.7 时尚与服装计划

时尚计划师和电商平台使用文生图技术进行服装计划和假造试穿体验。电商平台则可以结合用户身材数据,让用户输入笔墨描述想要的服装款式或风格,天生个性化假造试穿图片。
2.8 图书封面与插图天生

出版社和独立作者使用文生图模型自动天生与书籍主题契合的封面计划和内页插图,模型将创作出引人入胜的封面图像,自动化地为用户提供定制封面选项,简化流程。
四、示例

1. 源码

示例比较简单,博主直接搬运官网的代码,简单备注,可以直接运行:
from http import HTTPStatus
from urllib.parse import urlparse, unquote
from pathlib import PurePosixPath
import requests
import dashscope
from dashscope import ImageSynthesis

# 填写dashscope key
dashscope.api_key = "你的模型key"

def simple_call():

    # 文本提示
    prompt = '画一张大数据平台技术架构图'

    ''' 调用模型并设置入参
      model: 模型名称
      n:数量
      size:图片尺寸
    '''
    rsp = ImageSynthesis.call(model=ImageSynthesis.Models.wanx_v1,
                              prompt=prompt,
                              n=4,
                              size='1024*1024')

    # 响应ok
    if rsp.status_code == HTTPStatus.OK:
      # 遍历结果
      for result in rsp.output.results:
            file_name = PurePosixPath(unquote(urlparse(result.url).path)).parts[-1]
            # 保存图片
            with open('./%s' % file_name, 'wb+') as f:
                f.write(requests.get(result.url).content)
    else:
      print('Failed, status_code: %s, code: %s, message: %s' %
            (rsp.status_code, rsp.code, rsp.message))


if __name__ == '__main__':
    simple_call()
2. 运行结果

https://i-blog.csdnimg.cn/direct/6fbefb45c1c24c24924a132897dba6e6.png
https://i-blog.csdnimg.cn/direct/d709500ddf11486dbf0741a189663cd0.png
https://i-blog.csdnimg.cn/direct/5a63cce28bca407c83732789ac821a3b.png
https://i-blog.csdnimg.cn/direct/eda3a0b80a7d467cb08e8a0a74458a81.png
看到这4张图,博主感到有点“眩晕”。
结语

本文通过一个简单的案例(基于阿里云通义万相)先容了文生图模型的一样平常用法,渴望对有兴趣的盆友有所启发。
系列回首

Python酷玩之旅_数据分析入门(matplotlib)
Python酷玩之旅_怎样精确使用pipreqs完成依靠导出(解决UnicodeDecodeError)
Python酷玩之旅_怎样在Centos8顺遂安装Python最新版(3.12)
Python酷玩之旅_怎样毗连MySQL(mysql-connector-python)
https://i-blog.csdnimg.cn/direct/092df46d145a48ba9a27d8a79299cd59.jpeg

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: Python酷玩之旅_aigc文生图模型入门(通义万相)