OpenAI
OpenAI GPT Image 直接从 GPT-4 架构生成图像,将深度语言理解与视觉生成相结合。提供 GPT Image 1 和 1.5,支持质量和背景控制。
GPT Image 是 OpenAI 基于 GPT-4 架构的原生图像生成模型。与早期 DALL-E 模型不同,GPT Image 借助语言模型基础,能更深层地理解细致、多部分的提示词。GPT Image 1 每张 10 积分,提供可靠的通用生成和图像编辑支持。GPT Image 1.5 增加了质量级别——低(2 积分)、中(6 积分)和高(20 积分)——以及背景控制(自动、透明、不透明),适用于产品摄影和设计工作流。两者都支持透明 PNG 输出。1.5 的低品质级别是在 Martini 上以最低成本利用 GPT-4 级提示词理解的方式之一。
| 变体 | 说明 |
|---|---|
| GPT Image 1 | 原生 OpenAI 图像生成,支持编辑和多种尺寸。 |
| GPT Image 1.5 | 增强变体,支持质量级别、背景控制和透明输出。 |
在 Martini 的无限画布上将 GPT Image 与其他 AI 模型连接使用。无需 GPU,免费开始。
免费开始GPT Image 1 提供可靠的通用生成和图像编辑支持。GPT Image 1.5 增加了质量级别(低/中/高)、背景控制(透明、不透明、自动)和改进的细节——特别适用于产品摄影和设计工作流。
是的。GPT Image 1 和 1.5 都支持透明 PNG 输出。GPT Image 1.5 还提供显式背景控制——设置为"透明"用于产品抠图和合成工作。
GPT Image 取代了 DALL-E 成为 OpenAI 的图像生成模型。基于 GPT-4 架构而非单独的扩散模型,它在提示词理解方面有显著提升,特别是对复杂的多部分描述和细致的指令。
Midjourney
Midjourney v7 以标志性的美学风格生成极具艺术性和细节的图像。擅长创意插画、概念艺术和逼真渲染,提示词遵循度高,内置 Niji 模式可生成动漫风格。
查看详情Black Forest Labs
FLUX 是 Black Forest Labs 推出的快速高品质图像生成系列,以逼真输出和出色的提示词遵循度著称。变体从免费 Dev 模型到超高分辨率 Pro 输出。
查看详情Black Forest Labs
FLUX Kontext 是一个上下文感知的图像生成与编辑模型,使用参考图像在输出间保持角色和风格一致性。提供 Pro 和 Max 两个级别。
查看详情