ByteDance
Seedance 2 Omni 在一次已经接收最多 12 个参考素材的生成里加入角色参考图像——身份锁定 + 多模态上下文广度(音频参考、场景参考、色调参考)的独特组合。对一位运营高量内容、每集都变服装、场景、情绪但身份保持锚定的 AI 网红制作人,Seedance Omni 在每片 Sutui 经济性上很有优势。它是 Vidu Q2(最密参考)和 Kling O3 Reference(最紧编排)之间的务实中间选项。
Seedance Omni 的 12 个素材参考槽位是它的差异化所在。建好槽位:4 张角色参考(正面、四分之三、侧面、表现力)+ 1 张服装参考 + 1 张场景参考 + 1 张色板 + 1 张音频语气参考。角色参考锚定身份;其余锚定每集特有的上下文。Vidu 和 Kling 接受不了这种多模态密度。
Seedance 2.0 Omni Pro 是合并所有能力的变体:文生视频、图生视频、视频转视频和参考驱动生成。对一位在一个活动里跨多种镜头类型的品牌代言人,Omni Pro 是合适选择。Omni Premium 在批量周转时间紧时更快;Standard 用于成本敏感的草稿。
对一部集数系列,4 张角色参考在所有集里固定。只有服装参考 + 场景参考 + 色板 + 音频语气槽位变化。把画布保存时锁定角色参考,每集只换上下文参考。这就是画布即模板模式的最干净形态。
Seedance 把相机 + 运动语言读得稳。"朝 Mia 慢速向前移动镜头,柔和黄昏轮廓光,1:1 比例,6 秒。"别描写 Mia 的脸——参考处理这部分。描写相机、光线、她做的动作、时长。电影语言解锁 Seedance 的运动引擎。
Seedance Omni 的音频参考槽位偏置同一遍渲染的环境声。对一部要求声音品牌一致(生活方式 vlog 系列总是温暖咖啡馆环境声)的系列,钉一张音频语气参考并在所有集里复用。音频在整个系列里自动读得一致。
Seedance 支持六种宽高比。把同样角色 + 上下文设置渲染成 1:1(Meta)、9:16(TikTok/Reels)和 16:9(YouTube):复制节点改宽高比参数。参考保留;宽高比变化。身份在不同格式里读起来一致。
身份锁定的 Meta 剪辑版本。参考承担所有视觉重活;提示词处理相机和时机。
Slow forward dolly toward Mia, soft golden hour rim light, 1:1 aspect, 6 seconds. Wardrobe and location from references.
使用音频语气参考做环境连贯性的 TikTok 竖版剪辑。
Mia walks left to right through the location, slight handheld breathing, ambient cafe sound from audio reference, 9:16 vertical, 5 seconds
用色板参考引导色调的 YouTube 宽版剪辑。
Mia in profile, slow turn toward camera, palette and lighting from palette swatch reference, 16:9, 8 seconds
在 12 槽位 Omni 参考集合里堆 4 张角色参考 + 上下文参考(服装、场景、色板、音频语气)。
把画布保存时锁定角色参考;每集只换上下文参考以获得最干净的模板模式。
别在提示词里描写角色的脸——Seedance 从参考栈读取身份。
用音频语气参考做系列一致的环境声,不需要独立音频链。
同一设置渲多种比例时复制节点,而不是从头重写提示词。
密集多模态工作选 Omni Pro;批量速度紧时选 Omni Premium;草稿选 Standard。
Seedance 2 Omni 以六种宽高比输出 4-15 秒、1080p 片段,4 张参考 + 多模态上下文带来强身份。渲染时间:Standard 60-120 秒,Pro 90-180 秒。最适合高量集数内容——音频 + 色板 + 场景必须保持的同时锁定身份。在最大参考密度下要最紧的身份用 Vidu Q2;带原生对白唇形同步的编排动作用 Kling O3 Reference;Seedance 是务实中间选项。
在 Martini 的无限画布上将 Seedance 2.0 与其他 AI 模型连接使用。无需 GPU,免费开始。
免费开始Vidu
Vidu Q2 Subject Ref 每次生成接收 1-7 张角色参考图——本场景三个模型里参考槽位最密。对一位让"Mia"在 12 周内容系列里完全一致的 AI 网红制作人,这套 7 张人物设定页(正面、四分之三、侧面、全身、手部、表情范围)给 Vidu 比任何单锚点模型都更多的身份向量。结果是跨镜头脸/下巴/发际线锁定最强,尤其当服装和场景变化时。
查看教程Kling
Kling O3 Reference 增加了角色参考图像以维持跨剪辑外观一致,并支持对单独元素的语音控制。它共享 Kling 3.0 骨干(原生 4K、16 位 HDR、Omni Native Audio),是一位 AI 网红或品牌代言人需要跨多镜头交付唇形同步对白且要求电影节级别细节时的合适选择。在编排紧凑的动作上参考比 Vidu 更强;在参考密度上不如 Vidu Q2(Vidu 接收 7 张,Kling O3 Reference 读取较少但更严格地排序)。
查看教程