来自云龙湖轮廓分明的月亮 发表于 2024-11-26 10:09:07

AIGC实践-利用Amazon Bedrock的SDXL模型进行文生图

一、Bedrock 简介

Amazon Bedrock 是 Amazon Web Services (AWS) 提供的一种天生式 AI 服务。通过 Bedrock,用户可以方便地利用多种基础模型(Foundation Models),包括 OpenAI 的 GPT、Anthropic 的 Claude 等。这些模型可以用于各种天生式 AI 应用,包括文生图使命。本文将介绍怎样利用 Amazon Bedrock 的 SDXL模型 的 API 实现文生图。
二、开通Bedrock相应模型的利用权限

访问亚马逊官网,登录账号后,服务菜单里选择 Machine Learning,选择 Amazon Bedrock。
https://i-blog.csdnimg.cn/direct/82fc3665b8ce422982c4929fb7a8098c.jpeg
选择 Stable Diffusion。
https://i-blog.csdnimg.cn/direct/e1ae9abcb74b46b9a75dbc4e6bdc6b03.jpeg
初次利用需要开通相应模型的利用权限。点击 "请求模型访问权限"。
https://i-blog.csdnimg.cn/direct/629486e3e2104ece8d1be12afc311311.jpeg
点击 "启用特定模型"。
https://i-blog.csdnimg.cn/direct/1658c7451d51433196cbcf0a55a78474.jpeg
勾选 Claude 里的 Claude 3 Sonnet、Claude 3 Haiku、Claude、Claude Instant 四个模型。
https://i-blog.csdnimg.cn/direct/723603d797784f469231be8a008ea57a.jpeg
再勾选 Stability Al 里的 SDXL 1.0。
https://i-blog.csdnimg.cn/direct/039ab703d01740c6aa98250dcdd7c126.jpeg
填写 Anthropic 的应用场景详细信息。
https://i-blog.csdnimg.cn/direct/3b8750b5ad1043c896b82d48d8478684.jpeg
点击提交。
https://i-blog.csdnimg.cn/direct/8161036b04374fb8909216d096132e6d.png
提交完之后,我们刚刚勾选的五个模型会变成 "正在进行" 状态,需要等待几分钟。
https://i-blog.csdnimg.cn/direct/89357120ab2f4374bc3d8e7e879a919a.png
几分钟后,模型状态正常,变为 "已授予访问权限" 状态。
https://i-blog.csdnimg.cn/direct/3998750f755c4fab929570452a4ef938.png
三、SDXL模型支持的几种模式

操场里点击图像,选择模型。种别选择 Stability AI,模型选择 SDXL 1.0,推理默认 按需 即可。选择好点击 应用。
https://i-blog.csdnimg.cn/direct/1e3468576f514c72a71494bc1b56d021.png
我们进入到了图像操场页面,在这里我们可以通过调解设置天生满意差异要求的图片。
https://i-blog.csdnimg.cn/direct/257b1cce906a4d938a44f95659623236.png
设置解释:
操纵内容模式模型天生新图像(天生)或编辑(编辑)在参考图像中提供的图像否定提示不盼望模型天生的项目或概念,例如卡通或暴力推理图像上传图像作为图像天生或编辑的参考响应图像天生图像的输出设置,例如质量、方向、巨细和要天生的图像数目高级设置要传递给模型的推理参数 下面是 SDXL 1.0 模型 支持的几种模式:
1. 文生图

调解设置为:


[*]操纵: 天生图像
[*]提示词: a serene beach at sunset
[*]提示强度: 10
[*]天生步骤: 30
[*]种子: 10
点击运行,天生结果如图:
https://i-blog.csdnimg.cn/direct/5224bc350d4f4d39835c0555fdf451f8.png
2. 图生图

点击图片,操纵里选择编辑功能。
https://i-blog.csdnimg.cn/direct/72a8a55fdae949d0be473a36bc1b47fd.png
可以看到右侧推理图像已经填入我们刚刚天生的图像。将 操纵 选择为 天生变体。
https://i-blog.csdnimg.cn/direct/02697be8422c4f6db4c106cf0d7fe7ce.png
调解设置为:


[*]操纵: 天生变体
[*]提示词: add vibrant hues to the sky, enhance reflections on the water
[*]负面提示词: dull colors, lack of sunset details, unrealistic sky gradients, poorly rendered reflections
[*]提示强度: 30
[*]天生步骤: 50
[*]种子: 321
点击运行,天生结果如图:
https://i-blog.csdnimg.cn/direct/33c6cff02a3247d68a8a967571c10b13.png
3. 图像编辑

我们重新天生一个绿色茶园的配景图。
https://i-blog.csdnimg.cn/direct/c15bd007cf9e439785b7255061049922.png
操纵选择 编辑 ,选择需要更换的区域,输入提示词、选择提示强度,天生图片。
比如,我们要增加一只羊。
调解设置为:


[*]操纵: 编辑
[*]提示词: add a sheep
[*]提示强度: 10
https://i-blog.csdnimg.cn/direct/e82680edeb4346cf935c58320dcfb330.png
通过 Amazon Bedrock Stability AI SDXL 1.0 的 文生图、图生图、图像编辑 功能,我们可以开启简洁高效的视觉创作之旅,让创意变得触手可及。
四、调用Bedrock里Stability的API

我们利用 Jupyter 来实现 Bedrock 里 Stability 的API调用。
1. 创建AWS访问密钥

在 AWS控制台 的 安全根据 里申请 安全密钥。
https://i-blog.csdnimg.cn/direct/c1b65e7a3007405caa61b6eeaa9f5654.png
保存好我们的 访问密钥。
https://i-blog.csdnimg.cn/direct/86d3e8256e5f4d2a8e91a6bc0160e629.png
2. 安装相关环境

创建一个python环境,实行下面下令:
cd ~/environment/
curl 'https://dev-media.amazoncloud.cn/doc/workshop.zip' --output workshop.zip
unzip workshop.zip
https://i-blog.csdnimg.cn/direct/6dab7e6ef2ee48409e9608c23a93aa82.png
解压完成后,安装需要的包:
pip3 install -r ~/environment/workshop/setup/requirements.txt -U
https://i-blog.csdnimg.cn/direct/045bcf6a92f54974bb94165ce5ad5ac5.png
设置访问密钥:
aws configure
按提示输入以下信息:


[*]AWS Access Key ID
[*]AWS Secret Access Key
[*]默认区域名称(如 us-east-1)
[*]输特别式(如 json,也可以直接为 None)
https://i-blog.csdnimg.cn/direct/f0e01f6c684042b28122178b4f899530.png
3. 编写代码并调用

我们需要给 AWS 传一个 JSON 串,官网示例参数如下:
{
"modelId": "stability.stable-diffusion-xl-v1",
"contentType": "application/json",
"accept": "application/json",
"body": "{\"text_prompts\":[{\"text\":\"this is where you place your input text\",\"weight\":1}],\"cfg_scale\":10,\"seed\":0,\"steps\":50,\"width\":512,\"height\":512}"
}
https://i-blog.csdnimg.cn/direct/e7dc9cabbb4141d0ae2e5ae7b5e346b6.png
其中,body 的参数含义如下:
参数值含义作用text_prompts[{ "text": "this is where you place your input text", "weight": 1 }]文本提示- "text": 输入的形貌文字,模型将根据这个文字天生图像。
- "weight": 权重,控制模型对文本的关注程度。cfg_scale10引导强度数值越高,天生的图像越严格按照文本提示进行;数值较低时天生内容更具创造性和自由度。seed0随机种子控制天生的随机性;相同种子和相同输入天生同等图像,差异种子天生差异结果。steps50迭代步骤数步骤数越多,天生的图像质量越高,但耗时越长。width512图像宽度(像素)设置天生图像的横向分辨率。height512图像高度(像素)设置天生图像的纵向分辨率。 下面我们来编写代码:
选择 workshop/labs/api/bedrock_api.py 编写代码:
import json
import boto3
import base64
import os
from PIL import Image
import io

session = boto3.Session()

bedrock = session.client(service_name='bedrock-runtime') #creates a Bedrock client

bedrock_model_id = "stability.stable-diffusion-xl-v1"# set the foundation model
prompt ="a beautiful mountain landscape"# the prompt to send to the model
seed = 10

body = json.dumps({
    "text_prompts": [{"text": prompt}],
    "seed": seed,
    "cfg_scale": 10,
    "steps": 30,
})# build the request payload

# send the payload to Bedrock
response = bedrock.invoke_model(
    body=body, modelId=bedrock_model_id, accept='application/json', contentType='application/json')

# read the response
response_body = json.loads(response.get('body').read())
base64_image_data = response_body.get("artifacts")["base64"]
print(f"{base64_image_data}...")
# Convert base64 image data to an image and save it to a file
image_data = base64.b64decode(base64_image_data)
os.makedirs("data", exist_ok=True)
image = Image.open(io.BytesIO(image_data))
image.save('data/sd_generated_image.jpg')

调用这段代码:
python3 bedrock_api.py
https://i-blog.csdnimg.cn/direct/8b9a0acf6dc645a9bc6c3d8488ea062b.png
调用成功后,我们可以看到, workshop/labs/api/data/ 目录下天生了图片:sd_generated_image.jpg。
https://i-blog.csdnimg.cn/direct/5627130322ab485e9fb58e01ef7f6388.png
4. 调试和优化

① 查抄输入提示
天生的图片质量与输入提示(Prompt)的清晰度和详细程度密切相关。发起:


[*]形貌尽可能详细,例如 “A detailed painting of a dragon flying over a mountain during sunset”。
[*]包罗图片风格关键词,如 “realistic”, “abstract”, “oil painting”。
② 设置参数
根据需求,调解以下参数,可以优化天生结果:


[*] 分辨率:通过设置 width 和 height 参数调解图像的宽高分辨率(单位:像素)。提高分辨率(如从默认的 512x512 提升到更高值)可以增加图像细节,但可能会延长天生时间。
[*] 文本提示和权重:利用 text_prompts 参数提供形貌性文字(如场景或风格),并通过 weight 调解对该提示的关注程度。权重值越高,天生图像将越贴近形貌。
[*] 引导强度:通过 cfg_scale 控制模型对文本提示的遵循程度。较高的值(如 10 或以上)会更严格地匹配输入形貌;较低的值可能答应更具创造性的天生。
[*] 随机种子:设置 seed 参数固定天生的随机性,确保相同的输入条件下产生同等的图像结果。利用差异的种子值可以天生多样化的结果。
[*] 迭代次数:调解 steps 参数来控制图像天生的细化过程。更多的迭代(如从 50 提升到更高)通常会提升图像质量,但可能需要更长时间。
五、总结

Amazon Bedrock 为文生图功能提供了高效且灵活的解决方案,整合了多个顶尖的基础模型(如 Stable Diffusion SDXL 1.0),可以或许满意从创意设计到生产应用的多样化需求。通过其直观的 API 接口,开发者可以轻松调用模型,快速实现图像天生,并团结参数优化获得高质量的输出。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: AIGC实践-利用Amazon Bedrock的SDXL模型进行文生图