OpenAI
OpenAI GPT Image 2 是一款以品质优先、具备推理能力的图像模型,会在生成前先规划构图。提供顶尖的图中文字渲染、多语种排版和最多 16 张参考图的高保真编辑,输出最高可达 4K。
GPT Image 2 是 OpenAI 的新一代图像模型,于 2026 年 4 月 21 日以 ChatGPT Images 2.0 名义发布,随后通过 gpt-image-2 API 向开发者开放。相比注重速度与品质平衡的 GPT Image 1.5,GPT Image 2 采用品质优先策略——在生成前主动研究、规划并推理图像结构,被 OpenAI 称为首个真正具备智能体能力的图像生成模型。它在 Image Arena 文生图榜单上以 1,512 分、+242 的领先优势登顶第一,得益于显著提升的文字准确度、密集构图处理和对日语、韩语、中文、印地语、孟加拉语的多语种渲染。文生图和图生图共用同一端点族,最多接受 16 张参考图用于组合主体、风格与布局;支持从 1:1 到 21:9、9:16 等 11 种宽高比,单次可生成 1、2、3 或 4 张图。在 Martini 上提供 1K、2K、4K 三档分辨率,可按交付场景挑选——把它拖到画布上即可起稿带有推理化文字与产品标注的主图,再串联 FLUX Kontext 生成角色变体,或接入 Runway Gen4 / Kling 视频节点让结果动起来。

在 Martini 的无限画布上将 GPT Image 2 与其他 AI 模型连接使用。无需 GPU,免费开始。
免费开始GPT Image 1.5 通过低/中/高档位平衡速度与品质,并支持透明背景。GPT Image 2 是品质优先的推理模型,生成前先规划构图,单次可接受最多 16 张参考图,在 Image Arena 文生图榜单上以 +242 的差距位居第一,输出最高可达 4K,但不支持透明背景。需要顶级文字准确度和多语种排版选 2,需要透明背景或最轻量档位选 1.5。
GPT Image 2 提供 1K、2K、4K 三档分辨率。每次可生成 1、2、3 或 4 张图,支持从 1:1 到 21:9、9:16 等 11 种宽高比。
可以。GPT Image 2 支持图生图编辑,单次可传入最多 16 张参考图,因此可以在一轮生成中融合主体、风格参考与布局参考——非常适合产品变体、多语种广告组和参考驱动的构图。
OpenAI
OpenAI GPT Image 直接从 GPT-4 架构生成图像,将深度语言理解与视觉生成相结合。提供 GPT Image 1 和 1.5,支持质量和背景控制。
查看详情Midjourney
Midjourney v7 是辨识度最高的 AI 图像生成器,拥有同类最鲜明的美学风格。在 Martini 上可使用 V7 进行写实和绘画风格创作,Niji 7 用于动漫,Omni Reference 锁定角色一致性,并通过 Stylization、Variety、Weirdness 三个滑块进行精细控制——全部在画布中完成,无需 Discord。
查看详情Black Forest Labs
FLUX 是 Black Forest Labs 推出的快速高品质图像生成系列,以逼真输出和出色的提示词遵循度著称。变体从免费 Dev 模型到超高分辨率 Pro 输出。
查看详情