OpenAI

GPT Image

OpenAI GPT Image 直接从 GPT-4 架构生成图像，将深度语言理解与视觉生成相结合。提供 GPT Image 1 和 1.5，支持质量和背景控制。

GPT Image 是 OpenAI 基于 GPT-4 架构的原生图像生成模型。与早期 DALL-E 模型不同，GPT Image 借助语言模型基础，能更深层地理解细致、多部分的提示词。GPT Image 1 提供可靠的通用生成和图像编辑支持。GPT Image 1.5 增加了质量级别——低、中、高——以及背景控制（自动、透明、不透明），适用于产品摄影和设计工作流。两者都支持透明 PNG 输出。1.5 的低品质级别是 Martini 上利用 GPT-4 级提示词理解的最轻量方式。

免费试用 GPT Image

Illustrative sample of OpenAI GPT Image on the Martini canvas — a clean product render on a transparent-style background reflecting deep prompt understanding — 示意样图——代表性输出，非模型逐字渲染结果。

GPT Image 变体

变体	说明
GPT Image 1	原生 OpenAI 图像生成，支持编辑和多种尺寸。
GPT Image 1.5	增强变体，支持质量级别、背景控制和透明输出。

支持的功能

文本生成图像

图像到图像

图像编辑

参考图像

多图输入

标签

最适合

需要深度语言理解的复杂多部分提示词
具有透明背景的产品摄影
对现有图像的编辑和修改
具有稳定整体品质的通用生成

优势

对复杂细致提示词的超强理解
内置图像编辑——无需单独工具即可修改和优化
透明 PNG 输出，适用于设计和产品工作流
1.5 的质量级别让你平衡速度与保真度
背景控制（透明、不透明、自动）适用于产品拍摄

局限性

写实效果的整体视觉品质略低于 FLUX Pro 和 Imagen 4
视觉输出倾向于干净精致的美学——原始或粗犷的艺术风格较难实现
若是大量基础生成场景，FLUX.2 或 Imagen 4 Fast 等更轻量的模型出图更快

使用技巧

GPT Image 擅长处理详细的描述性提示词——写出完整场景而不是简短关键词。

使用 GPT Image 1.5 的透明背景用于需要合成的产品图像。

编辑模式适合优化——生成基础图像，然后编辑特定区域。

使用 GPT Image 1.5 的"高"品质和透明背景创建产品抠图，然后在多节点工作流中将其合成到其他模型生成的场景上。

在 Martini 上使用 GPT Image

在 Martini 的无限画布上将 GPT Image 与其他 AI 模型连接使用。无需 GPU，免费开始。

免费开始

常见问题

GPT Image 1 和 1.5 有什么区别？

GPT Image 1 提供可靠的通用生成和图像编辑支持。GPT Image 1.5 增加了质量级别（低/中/高）、背景控制（透明、不透明、自动）和改进的细节——特别适用于产品摄影和设计工作流。

GPT Image 可以创建透明 PNG 图像吗？

是的。GPT Image 1 和 1.5 都支持透明 PNG 输出。GPT Image 1.5 还提供显式背景控制——设置为"透明"用于产品抠图和合成工作。

GPT Image 和 DALL-E 相比如何？

GPT Image 取代了 DALL-E 成为 OpenAI 的图像生成模型。基于 GPT-4 架构而非单独的扩散模型，它在提示词理解方面有显著提升，特别是对复杂的多部分描述和细致的指令。

GPT Image

OpenAI GPT Image 直接从 GPT-4 架构生成图像，将深度语言理解与视觉生成相结合。提供 GPT Image 1 和 1.5，支持质量和背景控制。

免费试用 GPT Image

GPT Image 变体

变体	说明
GPT Image 1	原生 OpenAI 图像生成，支持编辑和多种尺寸。
GPT Image 1.5	增强变体，支持质量级别、背景控制和透明输出。

支持的功能

文本生成图像

图像到图像

图像编辑

参考图像

多图输入

标签

最适合

需要深度语言理解的复杂多部分提示词
具有透明背景的产品摄影
对现有图像的编辑和修改
具有稳定整体品质的通用生成

优势

对复杂细致提示词的超强理解
内置图像编辑——无需单独工具即可修改和优化
透明 PNG 输出，适用于设计和产品工作流
1.5 的质量级别让你平衡速度与保真度
背景控制（透明、不透明、自动）适用于产品拍摄

局限性

写实效果的整体视觉品质略低于 FLUX Pro 和 Imagen 4
视觉输出倾向于干净精致的美学——原始或粗犷的艺术风格较难实现
若是大量基础生成场景，FLUX.2 或 Imagen 4 Fast 等更轻量的模型出图更快

使用技巧

GPT Image 擅长处理详细的描述性提示词——写出完整场景而不是简短关键词。

使用 GPT Image 1.5 的透明背景用于需要合成的产品图像。

编辑模式适合优化——生成基础图像，然后编辑特定区域。

使用 GPT Image 1.5 的"高"品质和透明背景创建产品抠图，然后在多节点工作流中将其合成到其他模型生成的场景上。

在 Martini 上使用 GPT Image

在 Martini 的无限画布上将 GPT Image 与其他 AI 模型连接使用。无需 GPU，免费开始。

免费开始

常见问题

GPT Image 1 和 1.5 有什么区别？

GPT Image 可以创建透明 PNG 图像吗？

是的。GPT Image 1 和 1.5 都支持透明 PNG 输出。GPT Image 1.5 还提供显式背景控制——设置为"透明"用于产品抠图和合成工作。

GPT Image 和 DALL-E 相比如何？

GPT Image

GPT Image 变体

支持的功能

最适合

优势

局限性

使用技巧

在 Martini 上使用 GPT Image

常见问题

相关功能

延伸阅读

相关图像模型

GPT Image 2

Midjourney v7

FLUX

本网站使用 Cookie

GPT Image

GPT Image 变体

支持的功能

最适合

优势

局限性

使用技巧

在 Martini 上使用 GPT Image

常见问题

相关功能

延伸阅读

相关图像模型

GPT Image 2

Midjourney v7

FLUX