GPT Image 1.5
GPT Image 1.5 在 GPT Image 1 的基础上进一步提升了画面细节表现、提示词对齐能力,并在复杂场景和多种风格下提供更稳定的生成效果。
输入
提示词
最多上传 16 张图片 (可选)



上传
宽高比
输出质量
结果
查看生成记录| 模型与模态 | 积分 / 生成 | 我们的价格 (USD) | 官方价格 (美元) | 折扣 |
|---|---|---|---|---|
gpt image 1.5, t2i, i2i, medium imageOpenAI | 4 per image | $0.0179 | $0.034 | - 47% |
gpt image 1.5, t2i, i2i, high imageOpenAI | 22 per image | $0.0982 | $0.133 | - 26% |

提示词:
创建一张关于 [LANDMARK] 的信息图像,将该地标的真实照片与蓝图风格的技术注释和示意图叠加在一起。在角落加入一个手绘风格边框的标题“[LANDMARK]”,并添加白色粉笔风格的草图来展示关键结构。
GPT Image 1.5 提供稳定可靠的图像生成与精细化编辑能力,具备出色的提示词理解能力,适用于真实生产环境。
根据文本提示生成细节丰富、视觉一致性良好的图像,适用于产品视觉、创意概念和设计草稿等场景。
通过文本指令编辑图像的指定区域,同时保持原始构图、光照和整体视觉一致性。
能够准确理解并执行复杂提示词,实现对风格、对象、布局和视觉细节的精细控制。
同时支持从文本生成图像以及对已有图像进行转换,适配灵活的创作与编辑流程。
在多次编辑和迭代过程中保持视觉一致性,适用于多步骤图像处理工作流。
为 API 集成而设计,性能稳定、结果可预期,适合开发者导向的产品与服务。
适用于需要精确控制、细节编辑以及稳定视觉结果的使用场景。
GPT Image 1.5 非常适合用户上传图片并通过自然语言提出修改需求的应用场景,例如更换服装、调整外观细节、修改背景或添加、移除物体。模型能够在遵循详细指令的同时,保持人物特征、光照和构图一致性,非常适合面向消费者的照片编辑工具和依赖文本交互的 UGC 平台。

在需要对同一张图像进行多轮编辑的工作流中,GPT Image 1.5 能够在多次迭代中保持较强的视觉一致性。开发者可以逐步下达指令,例如细化风格、调整元素或修正细节,而无需从头生成,适合专业图像处理流程和需要精细控制的设计工具。

GPT Image 1.5 在生成包含清晰、可读文本的图像方面表现出色,例如标签、UI 组件、标识或产品包装。这一能力对于 UI 原型、引导页面、营销横幅和产品视觉内容尤为重要,相比通用图像模型,其文本布局与可读性更加可靠。

GPT Image 1.5 在分辨率、生成速度、编辑精度以及多步迭代一致性方面均优于 GPT Image 1,更适合生产级应用。
| 特性 | GPT Image 1 | GPT Image 1.5 |
|---|---|---|
最高分辨率 | 512×512 | 1024×1024 |
生成速度 | 约 6–8 秒 / 512×512 | 约 3–4 秒 / 1024×1024 |
提示词遵循度 | 中等 | 高 — 能准确执行复杂提示词 |
编辑精细度 | 基础的整体编辑 | 支持指令的局部精细编辑 |
多步迭代一致性 | 一致性较低 | 高 — 多次编辑中保持风格、光照与构图 |
图像中文本渲染 | 经常出现扭曲 | 即使在复杂场景中也清晰可读 |
支持的输入类型 | 仅文本 | 文本 + 图像(图生图编辑) |
API 成本效率 | 中等 | 响应更快,单张成本更低 |
输出风格稳定性 | 中等 | 高 — 输出风格一致 |