Vidu
Vidu Q2 Subject Ref 每次生成接收 1-7 张角色参考图——本场景三个模型里参考槽位最密。对一位让"Mia"在 12 周内容系列里完全一致的 AI 网红制作人,这套 7 张人物设定页(正面、四分之三、侧面、全身、手部、表情范围)给 Vidu 比任何单锚点模型都更多的身份向量。结果是跨镜头脸/下巴/发际线锁定最强,尤其当服装和场景变化时。
打开 Vidu 之前,先在 Nano Banana 2(源图像里最强的脸部锁定器)上生成人物设定页。瞄准 5-7 个不同角度和表情:正面肖像、四分之三、侧面、全身、中性表情、微笑表情、手部特写。这套设定页是身份基石——Vidu 会从你提供的每一张图采样身份。
在 Martini 画布上放下 Vidu Q2 Subject Ref 节点并附上全部 7 张角色图。Vidu 最多接收 7 张——少一些也行,但 7 张是身份密度的最大值。把正面肖像作为主参考钉好,其他张填充提示词可能调用的角度和表情。
Vidu 把提示词和参考一起读。对一个"Mia"侧面行走的镜头,提示词"侧面镜头,角色从左走到右,柔和日光"告诉 Vidu 偏向侧面参考。对一个正面对白镜头,"中景特写,角色看向相机说话"偏向正面参考。提示词的方向要和参考集合匹配。
对一个 12 周内容系列,每集服装和场景变——但身份必须锁。加载 7 张参考后,只在提示词里变服装和环境语言:"Mia 穿红色皮夹克,夜晚的市中心街道" → "Mia 穿奶油色毛衣,秋林小径" → "Mia 穿商务休闲,现代办公室"。身份稳定,其余是创作变化。
一段需要镜像之前片段运动的后续镜头(Mia 偏头的方式与第 3 集完全一样),切到 Vidu V2V Pro——它在一次生成里合并视频和图像参考。把之前的运动片段作为视频参考 + 同样 7 张人物设定页,Vidu 生成同时锁定运动和身份的新素材。
Vidu Q2 Subject Ref 节点配 7 张人物设定页搭好后,把画布保存为"Mia 系列"模板。每集新内容复用同一画布,只换服装 + 场景提示词。身份在整个系列里读起来完全一致,因为参考栈没变。这就是把 12 周内容系列变成一个画布的工作流。
服装 + 场景变化,身份由 7 张参考栈锁定。注意没有描写 Mia 的脸——Vidu 从参考里读取。
Mia in red leather jacket, downtown street at night, neon signs reflect on wet pavement, slow forward dolly, 6 seconds
侧面专属镜头。Vidu 从参考页采样侧面角度。
Profile shot of Mia walking left to right, autumn forest path, soft afternoon light, slight handheld breathing, 5 seconds
正面对白节拍。Vidu 调用正面参考及其表情范围。
Medium close-up of Mia looking toward camera, soft golden hour key light, ambient outdoor cafe sound, 4 seconds
Vidu Q2 Subject Ref 最多接收 7 张参考——加载到上限以获得最密的身份锁定。
先在 Nano Banana 2 上做人物设定页;它是源图像最强的脸部锁定器。
在提示词里变服装 + 场景,但绝不描述角色的脸——Vidu 从参考里读取。
把画布保存为系列模板——每集复用同一个 Vidu 节点 + 7 张参考。
需要跨集运动镜像时切到 Vidu V2V Pro 以合并视频 + 图像参考。
Vidu Q2 Subject Ref 输出 5-8 秒、1080p 片段,本页三个模型里角色身份锁定最强——7 张参考槽位是分水岭。渲染时间 90-150 秒。最适合 AI 网红的集数内容、固定代言人或时尚/美妆目录,身份必须在 12+ 镜头里保持。跨集运动镜像用 Vidu V2V Pro;性价比参考工作用 Seedance 2 Omni;编排紧凑动作用 Kling O3 Reference。
在 Martini 的无限画布上将 Vidu Q2 Subject Ref 与其他 AI 模型连接使用。无需 GPU,免费开始。
免费开始Kling
Kling O3 Reference 增加了角色参考图像以维持跨剪辑外观一致,并支持对单独元素的语音控制。它共享 Kling 3.0 骨干(原生 4K、16 位 HDR、Omni Native Audio),是一位 AI 网红或品牌代言人需要跨多镜头交付唇形同步对白且要求电影节级别细节时的合适选择。在编排紧凑的动作上参考比 Vidu 更强;在参考密度上不如 Vidu Q2(Vidu 接收 7 张,Kling O3 Reference 读取较少但更严格地排序)。
查看教程ByteDance
Seedance 2 Omni 在一次已经接收最多 12 个参考素材的生成里加入角色参考图像——身份锁定 + 多模态上下文广度(音频参考、场景参考、色调参考)的独特组合。对一位运营高量内容、每集都变服装、场景、情绪但身份保持锚定的 AI 网红制作人,Seedance Omni 在每片 Sutui 经济性上很有优势。它是 Vidu Q2(最密参考)和 Kling O3 Reference(最紧编排)之间的务实中间选项。
查看教程