AI学习：图像生成 chat3.5|电子爱好者

admin管理员组
文章数量:1622542

介绍

Images API 提供了三种与图像交互的方法：

根据文本提示从头开始创建图像（适用于DALL·E 3和DALL·E 2）。
通过使模型替换预先存在图像的某些区域，基于新的文本提示来创建图像的编辑版本（仅适用于DALL·E 2）。
创建现有图像的变体（仅适用于DALL·E 2）。

图像生成

图像生成端点允许您根据文本提示创建原始图像。在使用DALL·E 3时，图像的大小可以是1024x1024、1024x1792或1792x1024像素。
默认情况下，图像以标准质量生成，但在使用DALL·E 3时，您可以设置quality: "hd"以获得增强的细节。方形、标准质量的图像生成速度最快。
您可以使用DALL·E 3一次请求1张图像（通过进行并行请求可以请求更多），或者使用DALL·E 2并通过参数n一次请求最多10张图像。

from openai import OpenAI

client = OpenAI(
  api_key="sk-##########################",
)

# 用法
response = client.images.generate(
  model="dall-e-3",
  prompt="a white siamese cat",
  size="1024x1024",
  quality="standard",
  n=1,
)

image_url = response.data[0].url
print(response);

ImagesResponse(created=1701761542, data=[Image(b64_json=None, revised_prompt="A well groomed Siamese cat with a dominantly white coat is standing elegantly. Its blue almond-shaped eyes are piercing and sharp, while the distinctive color points on its ears, face, paws, and tail possess a contrasting darker hue. It has a sleek, short, and finely textured coat, a muscular, slim body and the cat exudes a royal touch in its overall demeanor, reflecting the breed's noble history.", url='https://oaidalleapiprodscus.blob.core.windows/private/org-Nyt7Lgiuy9Eeae2x3OXf2x7y/user-465jKD0bH6jMGgQxlfgS7JoH/img-xoMl87aBUv3hDUkpI4w4Vtkn.png?st=2023-12-05T06%3A32%3A22Z&se=2023-12-05T08%3A32%3A22Z&sp=r&sv=2021-08-06&sr=b&rscd=inline&rsct=image/png&skoid=6aaadede-4fb3-4698-a8f6-684d7786b067&sktid=a48cca56-e6da-484e-a814-9c849652bcb3&skt=2023-12-04T12%3A48%3A54Z&ske=2023-12-05T12%3A48%3A54Z&sks=b&skv=2021-08-06&sig=vD0H61U46QuP2oH60N%2B%2B74tQbsTjemASF4YrUNNa9Xg%3D')])

请求参数

参数	类型	必填	说明
`prompt`	string	必填	对所需图像的文字描述。dall-e-2最大长度为1000个字符，dall-e-3最大长度为4000个字符
`model`	string	可选	用于图像生成的模型，默认为dall-e-2
`n`	integer or null	可选	要生成的图像数量。必须在1和10之间。对于dall-e-3，仅支持n=1，默认为1
`quality`	string	可选	将生成的图像质量。hd创建具有更精细细节和整体一致性的图像。此参数仅对dall-e-3支持，默认为standard
`response_format`	string or null	可选	返回生成的图像的格式。必须是url或b64_json之一，默认为url
`size`	string or null	可选	生成图像的尺寸。对于dall-e-2，必须是256x256、512x512或1024x1024之一。对于dall-e-3模型，必须是1024x1024、1792x1024或1024x1792之一，默认为1024x1024
`style`	string or null	可选	生成图像的风格。必须是vivid或natural之一。Vivid使模型倾向于生成超现实和戏剧性的图像。Natural使模型生成更自然、不那么超现实的图像。此参数仅对dall-e-3支持，默认为vivid
`user`	string	可选	代表您的最终用户的唯一标识符，有助于OpenAI监控和检测滥用，了解更多

返回参数

参数	类型	说明
`b64_json`	string	如果response_format是b64_json生成的图像的Base64编码的JSON
`url`	string	如果response_format是url 生成的图像的URL（默认）。
`revised_prompt`	string	如果对提示进行了任何修改用于生成图像的提示。

图像变体

检测图片的大小和图片的格式，图片要为png格式且不能大于4MB

import os
from PIL import Image
def get_image_size_in_mb(image_path):
    try:
        size_in_bytes = os.path.getsize(image_path)
        size_in_mb = size_in_bytes / (1024 * 1024)
        return size_in_mb
    except Exception as e:
        print(f"无法获取图片大小: {e}")
        return None


image_path = "image.png"
image_size_in_mb = get_image_size_in_mb(image_path)

if image_size_in_mb is not None:
    print(f"图片大小：{image_size_in_mb:.2f} MB")
    
def is_png(image_path):
    try:
        with Image.open(image_path) as img:
            return img.format == "PNG"
    except Exception as e:
        print(f"无法打开图片 {image_path}: {e}")
        return False

is_png_format = is_png(image_path)

if is_png_format:
    print("图片是PNG格式")
else:
    print("图片不是PNG格式")

response = client.images.create_variation(
  image=open("image.png", "rb"),
  n=1,
  size="512x512"
)
image_url = response.data[0].url
print(response);

ImagesResponse(created=1701763066, data=[Image(b64_json=None, revised_prompt=None, url='https://oaidalleapiprodscus.blob.core.windows/private/org-Nyt7Lgiuy9Eeae2x3OXf2x7y/user-465jKD0bH6jMGgQxlfgS7JoH/img-JYnrvgWjz2s97ucJjdyYjhky.png?st=2023-12-05T06%3A57%3A46Z&se=2023-12-05T08%3A57%3A46Z&sp=r&sv=2021-08-06&sr=b&rscd=inline&rsct=image/png&skoid=6aaadede-4fb3-4698-a8f6-684d7786b067&sktid=a48cca56-e6da-484e-a814-9c849652bcb3&skt=2023-12-04T23%3A07%3A58Z&ske=2023-12-05T23%3A07%3A58Z&sks=b&skv=2021-08-06&sig=9oXioWW4VOliOHnk8wN7NDF7Cu9PiRKGcVTJHvIxiyI%3D')])

请求参数

参数	类型	必填	默认	说明
`image`	file	必填		用作变体基础的图像。必须是有效的PNG文件，小于4MB，并且是正方形
`model`	string	可选	默认为dall-e-2	用于图像生成的模型，目前仅支持dall-e-2。
`n`	integer or null	可选	默认为1	要生成的图像数量，必须在1和10之间。对于dall-e-3，仅支持n=1。
`response_format`	string or null	可选	默认为url	返回生成的图像的格式。必须是url或b64_json之一。
`size`	string or null	可选	默认为1024x1024	生成图像的尺寸。必须是256x256、512x512或1024x1024之一。
`user`	string	可选		代表您的最终用户的唯一标识符，有助于OpenAI监控和检测滥用。

图像编辑

client.images.edit(
  image=open("otter.png", "rb"),
  mask=open("mask.png", "rb"),
  prompt="A cute baby sea otter wearing a beret",
  n=2,
  size="1024x1024"
)
print( response.data[0].url);

ImagesResponse(created=1701763066, data=[Image(b64_json=None, revised_prompt=None, url='https://oaidalleapiprodscus.blob.core.windows/private/org-Nyt7Lgiuy9Eeae2x3OXf2x7y/user-465jKD0bH6jMGgQxlfgS7JoH/img-JYnrvgWjz2s97ucJjdyYjhky.png?st=2023-12-05T06%3A57%3A46Z&se=2023-12-05T08%3A57%3A46Z&sp=r&sv=2021-08-06&sr=b&rscd=inline&rsct=image/png&skoid=6aaadede-4fb3-4698-a8f6-684d7786b067&sktid=a48cca56-e6da-484e-a814-9c849652bcb3&skt=2023-12-04T23%3A07%3A58Z&ske=2023-12-05T23%3A07%3A58Z&sks=b&skv=2021-08-06&sig=9oXioWW4VOliOHnk8wN7NDF7Cu9PiRKGcVTJHvIxiyI%3D')])

请求参数

参数	类型	必填	默认	说明
`image`	file	必填		要编辑的图像。必须是有效的PNG文件，小于4MB，并且是正方形。如果未提供`mask`，则图像必须具有透明度，透明度将被用作掩码。
`prompt`	string	必填		所需图像的文字描述。最大长度为1000个字符。
`mask`	file	可选		另一幅图像，其完全透明的区域（例如alpha为零的区域）指示应编辑图像的位置。必须是有效的PNG文件，小于4MB，并且与图像具有相同的尺寸。
`model`	string	可选	默认为dall-e-2	用于图像生成的模型。目前仅支持dall-e-2。
`n`	integer or null	可选	默认为1	要生成的图像数量，必须在1和10之间。
`response_format`	string or null	可选	默认为url	返回生成的图像的格式。必须是url或b64_json之一。
`size`	string or null	可选	默认为1024x1024	生成图像的尺寸。必须是256x256、512x512或1024x1024之一。
`user`	string	可选		代表您的最终用户的唯一标识符，有助于OpenAI监控和检测滥用。

本文标签：图像 AI

版权声明：本文标题：AI学习：图像生成 chat3.5 内容由热心网友自发贡献，该文观点仅代表作者本人，转载请联系作者并注明出处：https://m.elefans.com/xitong/1728872392a1177410.html，本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，一经查实，本站将立刻删除。

更多相关文章

xp系统

NLP+VS︱深度学习数据集标注工具、图像语料数据库、实验室搜索ing...

4天前

~~因为不太会使用opencv、matlab工具，所以在找一些比较简单的工具。 . 一、NLP标注工具来源：《构想：中文文本标注工具（附开源文本标注

python数据标注工具_十个最常用深度学习图像视频数据标注工具

4天前

转载自：OpenCV学堂，未经允许不得二次转载从此以后图像与视频数据标注不用为找工具发愁！好东西记得分享图像数据标注概述在深度学习领域，训练数据

目标检测算法——图像分割数据集汇总（附下载链接）

4天前

>>>深度学习Tricks，第一时间送达<<< 🎄🎄近期，小海带在空闲之余，收集整理了一

一文读懂：AI时代为什么需要DPU？

4天前

各位小伙伴们大家好哈，我是老猫。今天跟大家来聊聊DPU。我们知道，AI时代的到来，数据中心快速发展，CPU不仅需要提供强大计算能力&#x

SoC芯片设计-AI加速器互连技术分析

3天前

SoC芯片设计系列-AI加速器互连技术AI加速器互连技术 1、概述 AI加速器互连技术，高效数据传输与计算资源协同的核心，尤其在高性能计算、数据中心与分布式计算中。关键互连

2024三掌柜赠书活动第三十期：秒懂AI小红书：7招玩转素人博主变现

3天前

目录前言打工人下班搞自媒体副业？ 7招玩转素人博主变现 1. 智能选题，紧跟潮流 2. 个性化内容创作 3. 精准投放，高效引流 4. 合作推广&#

三分钟回顾2017十大标志性人工智能事件：AI十宗最！

3天前

2017是众所周知的人工智能元年，确实，在这一年发生了许多标志性的人工智能事件，不仅仅是企业，国内陆续提出多个人工智能相关的国家级战略规划&#x

DICOM医学图像处理：DICOM存储操作之“多幅BMP图像数据存入DCM文件”

3天前

背景：本专栏“DICOM医学图像处理”受众较窄，起初只想作为自己学习积累和工作经验的简单整理。前几天无聊浏览了一下，发现阅读量两极化严重，主要集中在“关于BMP（JPG）与DCM格式转换”和“DICOM 通讯协议”，尤其

图像处理中的一些术语（特别是图像分割）

3天前

基本术语 digital image：数字图像 digital image processing：数字图像处理 image digitalization：图像数字化 imag

单应矩阵，基本矩阵，本质矩阵 1.归一化图像坐标 2.本质矩阵 essential matrix 2.1 本质矩阵的推导 2.2特点 3.相机内参 4.基本矩阵 fundamental matrix

2天前

来源：http:wwwblogsyouzxp6385513.html#wiz_toc_9 1.归一化图像坐标 2.本质矩阵 essential matrix 2.1 本质矩阵的推导 2.2特点 3.相机内参

【大模型应用开发动手做AI Agent】自主创建数据洞察

2天前

1. Background Introduction In the rapidly evolving world of artificial intelligence (AI), the development of large mode

aiml_您应该在本周（7月18日）阅读有趣的AIML文章

1天前

aiml 分析与意见 (ANALYSIS AND OPINION) AI tech and systems are developing at a rapid rate, new inventions and techniques are

Windows程序设计（2）：载入一幅图像并显示

12小时前

用Matlab载入一张图，再显示，好像非常非常容易… C语言就完全不一样了。很复杂。原因很简单，因为Matlab都封装好了嘛，而C语言要把所有的细

拆解搜狗：AI护城河与生态进化论

9小时前

平静已久的搜索市场，眼下风云又起。随着华为、字节跳动等巨头玩家的破圈入局，第三方搜索持续发力以及5G新入口、AI新技术的出现，都为长期以来保持稳定格局的搜索市场带来更多可

python 集群_带有Python的AI-无监督学习：集群

2小时前

python 集群带有Python的AI-无监督学习：集群 (AI with Python - Unsupervised Learning: Clustering) Unsupervised machine lear

图像匹配算法研究之sift算法

2小时前

昨天查了一天的资料，也没搞懂SIFT到底是个什么东西，今早上终于找到了一篇讲解比较详细的博客，转载收藏啦 SIFT算法由D.G.Lowe 1999年提出&#xff0c

无人机航拍图像匹配——SIFT算法实践（含代码）

2小时前

无人机航拍图像匹配——SIFT算法实践（含代码） 一.摘要二.SIFT算法的原理1.尺度空间极值检测 &关键点定位尺度不变性&尺度空间高斯金字塔 2.方向分配3.特征描述4 .特征

图像拼接 SIFT资料合集

2小时前

转自 http:blog.csdnstellar0articledetails8741780 分类： 最近也注意一些图像拼接方面的文章，很多很多，尤其是全景图

机器学习笔记 - 基于传统方法深度学习的图像配准

1小时前

一、图像配准图像配准是将一个场景的不同图像变换到同一坐标系的过程。这些图像可以在不同的时间（多时间配准）、由不同的传感器（多模态配准）和或从不同的视点拍摄。这些图像之间的空间关系可以是刚性的（平移和旋转）、仿射

电子爱好者 - 最新技术资讯及电子产品介绍！

AI学习：图像生成 chat3.5

介绍

图像生成

图像变体

图像编辑

更多相关文章

NLP+VS︱深度学习数据集标注工具、图像语料数据库、实验室搜索ing...

python数据标注工具_十个最常用深度学习图像视频数据标注工具

目标检测算法——图像分割数据集汇总（附下载链接）

一文读懂：AI时代为什么需要DPU？

SoC芯片设计-AI加速器互连技术分析

2024三掌柜赠书活动第三十期：秒懂AI小红书：7招玩转素人博主变现

三分钟回顾2017十大标志性人工智能事件：AI十宗最！

最新的超声图像分割研究概览（Ultrasound-image-processing）

DICOM医学图像处理：DICOM存储操作之“多幅BMP图像数据存入DCM文件”

图像处理中的一些术语（特别是图像分割）

单应矩阵，基本矩阵，本质矩阵 1.归一化图像坐标 2.本质矩阵 essential matrix 2.1 本质矩阵的推导 2.2特点 3.相机内参 4.基本矩阵 fundamental matrix

【大模型应用开发 动手做AI Agent】自主创建数据洞察

aiml_您应该在本周（7月18日）阅读有趣的AIML文章

Windows程序设计（2）：载入一幅图像并显示

拆解搜狗：AI护城河与生态进化论

python 集群_带有Python的AI-无监督学习：集群

图像匹配算法研究之sift算法

无人机航拍图像匹配——SIFT算法实践（含代码）

图像拼接 SIFT资料合集

机器学习笔记 - 基于传统方法深度学习的图像配准

发表评论

推荐文章

IPV4_FAILURE_FATAL=yes致IPV6的DHCP使能无效

ESP8266（基于arduino平台）每篇一个知识点—1.wifi STA模式连接指定wifi

内存中 OLTP - 常见的工作负荷模式和迁移注意事项（二）

PAT乙级-1018 锤子剪刀布 (20 分)

win10计算机护眼,win10系统设置护眼模式的三种方法

热门文章

sftp 上传文件报错 error while writing: received failure with description ‘Failure‘

Maven : Failure to find jar

微信内点击链接或扫描二维码可直接用外部浏览器打开H5链接的解决方案

创新正当时 -「Innovation 2021」网易应用创新开发者大赛决赛十强正式集结

树莓派4B——Ubuntu 18.04.05安装和基础配置教程（包括WIFI和远程桌面配置、ROS和主从机控制）

PS2022神经滤镜Neural Filters离线安装包(PS2022PS2021)

ESP32C3 WiFi 连接

如何更改PDF阅读器的阅读模式？

【虚拟机】VirtualBox 安装 Windows 11 虚拟机简介

搜狗皮肤php怎么转换,搜狗皮肤PHP怎么使用 搜狗输入法皮肤PHP使用方法

最新文章

戴尔i3 10100处理器装win7系统及bios设置教程(支持集显安装)

Win10 linux子系统文件位置

网络发现不了其他计算机,win10网络发现不了其他电脑怎么办_win10网络里找不到其他电脑如何处理...

win10删除右键菜单多余项

Win10的投屏功能无法使用问题解决思路

服务器不能用pe安装win7系统安装,PE安装win7系统失败的完美解决方案

win10更新系统后，键盘和触摸板不能用的问题

win10 自带的远程桌面连接怎么用？

关于win10系统还原报错的解决方案

计算机怎样设置默认美式键盘,完美：如何在win10系统中将默认输入法设置为美式键盘...

mac系统下，怎么装win7系统？

win10右键文件夹无反应

解决win10右下角输入法出现一个‘拼’字图标

WIN10下ADB工具包安装的教程和总结--201809

win10设置为高性能之后，字体模糊有锯齿

小米手机肿么还原时钟

15000流明是多少瓦

一般普通投影机功率多大?

苹果绿联转换器有些投影机不能用

坚果V9投影机具体参数?

有关九年级作文850字精选

80后90后_高一作文

中级卫生专业资格中医全科学主治医师中级模拟题2021年(9)案与解析

(精品)师范大学招考硕士研究生课程八六0试卷

ZXMVC8900(V3

【模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313】模拟人生4（The Sims 4）性感露背黑色亮片礼服MOD V20190313 官方免费下载

【生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD】生化危机2：重制版（Resident Evil 2 Remake）克莱尔红头发深色服装MOD 官方免费下载

【模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311】模拟人生4（The Sims 4）性感露背深V领吊带裙MOD V20190311 官方免费下载

【模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311】模拟人生4（The Sims 4）科幻风宇宙飞船家庭住宅MOD V20190311 官方免费下载

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改 官方免费下载

如何实现高效的treenode搜索算法

treenode与链表有何本质区别

在哪些场景下应优先考虑使用treenode

treenode在树形结构中的角色是什么

【大模型应用开发动手做AI Agent】自主创建数据洞察

搜狗皮肤php怎么转换,搜狗皮肤PHP怎么使用搜狗输入法皮肤PHP使用方法

【鬼泣5（Devil May Cry V）v1.0十四项修改】鬼泣5（Devil May Cry V）v1.0十四项修改官方免费下载