Alibaba
Wan VACE Video Edit 是阿里 Wan 系列里的开源权重 V2V 编辑器——支持最多 3 张参考图引导风格和内容变化,对一支需要按高量做参考驱动编辑而不想被高端模型价格压垮的品牌团队来说是理想选择。对活动片段的批量换装(一套模板化的品牌转向跨 20+ 个素材),Wan VACE 的开源权重架构在 Sutui 上够便宜同时输出忠实于参考的编辑。当替换目标是角色时配 Wan Animate Mix。
Wan VACE Video Edit 接收一段源视频 + 最多 3 张参考图。在 Martini 画布上,把源送进视频参考节点,再附 1-3 张图像参考。三张是上限:通常一张给色调/观感,一张给环境,一张给风格细节。超过三张会让模型稀释。
冬季转向的编辑要用不同的参考角色:参考 1 = 冬季色调情绪板,参考 2 = 雪景环境图,参考 3 = 冬季布料纹理细节。每个参考贡献不同方向的向量。三张重叠的冬季情绪板没有新增信息;三张角色不同的参考精确地引导模型。
Wan VACE 在每次只加一张参考时响应最稳。第一遍:源 + 色调参考。审阅。第二遍:上次输出 + 环境参考。审阅。第三遍:+ 风格细节参考。这种逐步法把变化控制住,让你在合适的重渲深度停下。
Wan VACE 同时读提示词和参考。提示词应匹配参考的方向而不重述它们。"重渲为冬季早晨,保留角色运动和时机,色调和环境渐进漂移。"参考处理视觉具体性;提示词引导时机和保留约束。
Wan 的开源权重架构是成本胜势——VACE 每次渲染的 Sutui 明显低于 Aleph 或 Kling O3。对一个换装 20+ 个片段且共用同一参考集合的活动,先在画布上把 Wan VACE 节点和三张参考搭好一次,然后把源片段在画布上复制以批量处理。总积分通常是 Aleph 的一半。
VACE Video Edit 为风格/内容编辑而生,对角色替换专精度较弱。如果简报是"把这个角色换成那个",改走 Wan Animate Mix——它接收一段源视频和一张替换角色图像,在保留运动的同时替换主体。VACE 适合环境/风格/物件编辑;Animate Mix 适合角色。
配三张参考的伴随提示词:色调 + 环境 + 纹理。提示词是方向盘。
Restyle to winter morning, preserve character motion and timing, palette and environment shift gradually
带运动保留的美学漂移。配一张绘画参考图。
Apply oil-painting aesthetic across all surfaces, preserve original action and camera move, gradual brushstroke buildup
带品牌身份约束的时间转向。"保留品牌 logo 不变"在模板化活动里很关键。
Shift to dusk blue hour with warm street light glow, preserve all character action, keep brand logo unchanged
Wan VACE 接受最多 3 张参考——给每张分配不同角色(色调、环境、纹理)而不是重叠。
逐步应用编辑——每次一张参考——把变化控制住。
开源权重架构意味着 Sutui 更便宜——批量工作(20+ 片段共享参考集)的最佳选择。
专做角色替换用 Wan Animate Mix,而不是 VACE Video Edit。
参考配方向性提示词;提示词是方向盘,参考是发动机。
Wan VACE Video Edit 以源时机和分辨率(通常 720p-1080p,按档位变化)输出。每次渲染 90-180 秒,明显比 Aleph 或 Kling O3 快且便宜。最适合同一参考集合应用到许多片段的批量工作。代价:精细细节编辑不如 Kling O3 Video Edit,创作基调转向不如 Runway Aleph。当预算和数量胜过高端保真时是正确的工具。
在 Martini 的无限画布上将 Wan VACE Video Edit 与其他 AI 模型连接使用。无需 GPU,免费开始。
免费开始Runway
Runway Aleph 是精确保留相机运动和时机、同时重风格化观感的 V2V 模型。对一个品牌团队有源素材需要季节性换装(夏季活动改成冬季、白天广告推到黄昏)的情况,Aleph 是最干净的路径:输入原片段加一张观感参考图,输出读起来像同一段镜头在新世界里。不用重新跑提示词,不用重拍。
查看教程Kling
Kling O3 Video Edit(Omni Edit)是 Kling O3 系列里的 V2V 变体,接收现有素材并替换角色、环境或特定元素,同时保留原始运动和时机。它共享 Kling 3.0 骨干——原生 4K 最高 60fps、16 位 HDR、Omni Native Audio。对一支已经在 Kling 原生管线上的品牌团队,O3 Video Edit 是同家族里的编辑步骤;对需要做元素级替换的任务(汽车上的 logo、服装颜色),它是本页三个编辑模型中最"外科手术式"的。
查看教程