返回顶部
热门问答 更多热门问答
技术文章 更多技术文章

OpenAI 图像生成 API 开放!开发者也能“一键出图”了

[复制链接]
链载Ai 显示全部楼层 发表于 昨天 18:06 |阅读模式 打印 上一主题 下一主题


图像生成的新时代,来了。这一次,不再只是“艺术家用AI玩玩”,而是每一个开发者,都能把视觉魔法装进自己的App里

今天OpenAI正式开放图像生成API接口,背后搭载的是他们新一代的多模态模型——gpt-image-1,也就是ChatGPT背后的GPT-4o的“画画脑”。

全场景通吃的“画图神器”,终于开放!

自从 GPT-4o 上线图像生成功能以来,仅一周时间,全球 1.3 亿用户就撸出了 7 亿+ 张图,风格横跨动漫、写实、童话、赛博、扁平……应有尽有,直接刷爆社媒,还顺手把服务器都卷出了热浪。

撇开吉卜力的风格不谈,OpenAI 的这款模型本质上靠的不是情怀,而是精准提示遵循能力碾压行业平均线。相比之下,Midjourney V7虽然更新了草图模式,但在画面一致性和上下文理解上,还是差了一截。

不过,这些“魔法般的体验”一直只对C端用户开放,企业和开发者早就嗷嗷待哺。今天,API终于来了。

从此,不止你会玩,你的产品也能会画图了。


开发者最爱:灵活、精细,还能按需定制

这个 API 有多香?简单列几个关键点你就懂了:

  • 风格丰富:不管是吉卜力、赛博朋克、低多边形还是写实风,一句话就能调出你要的感觉;最高支持1536×1024 像素
  • 文字嵌图很精准:英文效果非常稳,中文偶尔还会翻车,但已经比老一代模型进步不少;
  • 上下文记得牢:能连续对话、迭代创作,不用从头再说一遍;
  • 参数自由调:尺寸、颜色、透明度全都可以微调,想要透明底?直接支持!
  • 格式全家桶:PNG、JPEG、WebP全都支持,最大单图 20MB,输出够灵活

此外,图像 API 提供了两种核心能力

  • ?生成图像:根据文本提示从零开始画;
  • ✂️编辑图像:上传已有图片,用新提示局部或整体修改。

甚至支持超长 Prompt(最多 32000 字符)——比 DALL·E 那代直接高一个量级,真·能听你说废话也不烦。

一句话总结:不会画画也没关系,用它你就是“下一代视觉设计师”。


开发者上手示例(Python + OpenAI SDK)

GPT-Image-1 的 API 不仅支持自定义尺寸、风格、透明度输出,还支持一次生成多张图(n参数最多支持10张)。下面是一个用 Python 快速生成图片并保存的完整示例:

fromopenaiimportOpenAIimportbase64client=OpenAI()prompt="""Achildren'sbookdrawingofaveterinarianusingastethoscopetolistentotheheartbeatofababyotter."""result=client.images.generate(model="gpt-image-1",prompt=prompt)image_base64=result.data[0].b64_jsonimage_bytes=base64.b64decode(image_base64)withopen("otter.png","wb")asf:f.write(image_bytes)
生成的图如下:
除了会“凭空造图”,它还能修图、模仿、套图,连“视觉小工”都不放过?

?图像编辑 & 参考生图:不仅会画,还会改、会学

除了从零开始生成图像,GPT-image-1 还支持一整套强大的图像编辑与参考生图能力,让它真正具备“创作 + 修图 + 模仿”的多栖能力:

  • ✏️编辑已有图像:你可以上传一张图片,再加上新的 Prompt,让它在原图基础上进行整体重绘或细节调整;
  • 局部修复(inpainting):上传图像 + 遮罩,精准替换特定区域,修人脸、补背景、去水印都不在话下;
  • 参考图生成(image reference):上传一张或多张参考图,AI会从中提取风格、结构或物体特征,生成融合参考内容的新图像。

举个例子:你上传 4 张图片,然后告诉 AI “给我生成一张礼品篮,里面放这些东西”——它就能自动组合成图,从“会画”进化到“懂组合”。

importbase64fromopenaiimportOpenAIclient=OpenAI()prompt="""Generateaphotorealisticimageofagiftbasketonawhitebackgroundlabeled'Relax&Unwind'witharibbonandhandwriting-likefont,containingalltheitemsinthereferencepictures."""result=client.images.edit(model="gpt-image-1",image=[open("body-lotion.png","rb"),open("bath-bomb.png","rb"),open("incense-kit.png","rb"),open("soap.png","rb"),],prompt=prompt)image_base64=result.data[0].b64_jsonimage_bytes=base64.b64decode(image_base64)#Savetheimagetoafilewithopen("gift-basket.png","wb")asf:f.write(image_bytes)


?价格怎么说?不算最便宜,但性价比真不低

GPT-image-1 的 API 计费方式分得非常细,按token 数量来算,具体如下:

  • ?文本输入(你写的Prompt):100 万 token = $5
  • ?️图像输入(如果你上传一张图给它参考):100 万 token = $10
  • ?图像输出(生成出来的图):100 万 token = $40

换句话说,按图像大小和质量估算,单张图的价格大致如下:

  • ?低质量图:$0.02(适合快速迭代、草图阶段)
  • ⚖️中质量图:$0.07(大多数日常使用都够用)
  • 高质量图:$0.19(用于商业发布、印刷级别)

虽然单价看上去比一些竞品略高,但考虑到它的图文精准度、上下文保持能力和图像一致性,可以说——贵得有理,用得值

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

链载AI是专业的生成式人工智能教程平台。提供Stable Diffusion、Midjourney AI绘画教程,Suno AI音乐生成指南,以及Runway、Pika等AI视频制作与动画生成实战案例。从提示词编写到参数调整,手把手助您从入门到精通。
  • 官方手机版

  • 微信公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2025-2025. | 链载Ai
  • 桂ICP备2024021734号 | 营业执照 | |广西笔趣文化传媒有限公司|| QQ