在 Nano Banana 2 上一次建好 AI 人设,在 Martini 画布上出能跨姿势、服装、场景切换的人物设定页。Nano Banana 2 是栈里最强的脸部锁定:它接受最多 10 张参考图,输出 1K、2K 或 4K,从同一规范参考跨 50+ 次生成保持脸部一致。一周一更、12 周保持一个人设一致的 AI 影响者制作人,这就是关键模型——链上其他模型都从这里继承锁定。
从一张高质量人物肖像开始——上传照片、AI 生成基线,或 Nano Banana 2 从简报生成的。把它作为规范参考图放到画布上。这是后续每次生成的 1 号槽位。身份在这张图锁定;下游可以变姿势、服装、场景,但脸不变。
Nano Banana 2 每次生成读最多 10 张参考图。除了规范脸:服装参考(2 号槽位)、姿势参考(3 号)、光线情绪板(4 号)、场景静态图(5 号)。模型平衡 10 个槽位——脸从 1 号、服装从 2 号、姿势从 3 号,依此类推。这种多参考方式让 Nano Banana 2 成为栈里最强的角色一致性工具。
别描述人物本身("棕发、棕眼、椭圆脸")——参考图已经锁住了。描述变化的部分:姿势、服装、场景、光线、表情。"同一人物,三四分之一侧面,休闲街头服装,东京夜景街道,霓虹反光,微笑。"身份通过参考锁定;其他通过提示词走。
完整人物设定页跑同一画布上三次生成——正面、三四分之一(45 度侧面)和全侧面。每次都共享 1 号槽位;只换角度提示词。这三帧设定页成为 12 周系列里每次下游生成的主参考。
人物设定页一锁定,把 Nano Banana 2 节点复制 12+ 次——每个对应一种服装/场景组合(健身房、咖啡店、海滩日落、晚宴等)。每个复本保持 1 号槽位(规范脸)一致;只换变体提示词。这种扇出方式是 AI 影响者制作人在一个会话里出完整内容批的方式。
做图生视频的角色工作时,把锁定的 Nano Banana 2 输出作为起始帧接到 Sora 2、Kling 3 或 Vidu Q2 视频节点。视频模型从静态图继承角色身份——相机移动、身体动画时脸保持锁定。这种图到视频的交接是 Martini 画布独有的;竞品在模态边界破坏角色。
整个人物设定页的锚点帧。1 号槽位会在 12 周系列里每次下游生成中被重用。
Generate the canonical front-view character portrait. [Reference image slot 1: upload of canonical face]. Studio lighting, neutral background, sharp focus, 1K resolution, three-quarter body framing.
变体提示词聚焦变化的(角度、服装、场景)。参考保持身份;提示词保持其他。
[Reference slot 1: canonical face] + Same character, three-quarter profile angle, casual streetwear (oversized hoodie, dark jeans), Tokyo neon-lit street at night, slight smile, slight head tilt left. 4:5 aspect, 2K resolution.
多参考流程。1 号槽位 = 脸,2 号槽位 = 服装语境。Nano Banana 2 读两者并平衡。
[Reference slot 1] + [Reference slot 2: wardrobe moodboard - athletic apparel] + Same character, mid-workout, gym setting, dramatic side light, sweat detail, focused expression, 1:1 aspect, 2K resolution.
不同场景,同一身份。4K 分辨率给下游视频模型足够的细节,干净放大到竖版内容。
[Reference slot 1] + Same character, evening event outfit (cocktail dress in deep emerald), holding a champagne flute, soft golden ballroom lighting, three-quarter angle, 9:16 aspect, 4K resolution.
1 号槽位是神圣的。规范脸参考永远放 1 号槽位。系列中途换顺序会破坏锁定。
草稿用 1K,生产静态图用 2K,4K 只在下游视频放大需要余量时用。生成成本随分辨率扩展。
为了最好的脸部锁定,规范参考要干净、光线好、正面或三四分之一肖像。只有侧面的参考产生较弱的锁定。
只有需要时才在 2-5 号槽位加服装和场景情绪板。空槽位比嘈杂槽位强——Nano Banana 2 给每个参考权重。
别在提示词里描述五官("棕眼、椭圆脸")。参考图已经有了;再描述会引入偏移。
图到视频交接时,静态图用 4K 生成,让视频模型降采样。输入分辨率越高 = 运动输出越干净。
Nano Banana 2 返回 1K、2K 或 4K 输出,从同一 1 号槽位参考跨 50+ 次生成保持约 95% 的脸部一致。生成时间:1K 15-30 秒、2K 30-60 秒、4K 60-120 秒。每次生成最多 10 张参考输入——Martini 图像模型里参考槽位最密的。输出在画布上落成锁定静态图;接到服装/场景扇出、下游 Flux Kontext 做服装编辑,或 Sora 2/Kling 3 视频节点做动画角色内容。参考图条件化是任何只用提示词的流程复制不了的技术新意。
在 Martini 的无限画布上将 Nano Banana 2 与其他 AI 模型连接使用。无需 GPU,免费开始。
免费开始Black Forest Labs
在 Martini 上用 FLUX Kontext 把锁定的角色编辑到新服装、场景和姿势——它专门为指令式图像编辑而建,能保持主体身份。Nano Banana 2 生成规范人物设定页,FLUX Kontext 就是接收那张锁定静态图、在不丢脸的前提下修改它的服装/场景编辑器。两模型链(Nano Banana 2 锁身份、FLUX Kontext 换服装)是画布上最干净的角色一致性流水线。
查看教程Vidu
在 Martini 上用 Vidu Reference-to-Image 生成一致角色静态图——每次生成接受 1-7 张参考图,输出的人物静态图直接流入 Vidu 视频节点做匹配运动。Vidu 的参考流程为图到视频的角色流水线优化:同一模型家族在静态图上锁身份、也处理运动,消除模态边界的跨模型身份偏移。计划下游出角色视频内容的制作人,Vidu Reference-to-Image 是最干净的单供应商路径。
查看教程