Kling
Kling 3.0 是 Martini 上为包含人物的图像添加动画的最佳模型。其 Pro 档位生成所有图像转视频模型中最自然的面部表情、身体运动和头发物理效果。标准档位每秒 19 积分(5 秒片段 95 积分),Pro 每秒 25 积分(5 秒 125 积分)。价格差距不大,但人脸的质量差距很明显——Pro 处理微表情(眨眼节奏、嘴角上扬、微妙的头部倾斜),这些决定了"明显是 AI"和"等等,这是真的吗?"之间的差异。对于没有人物的风景和物体,Standard 完全足够。
源图像比提示词对图像转视频质量更重要——它是动画看起来自然还是勉强的最大单一因素。有隐含运动的图像产生显著更好的结果:正在迈步的人(模型继续行走运动)、风吹的头发(模型添加飘动运动)、即将拍打的海浪(模型完成波浪)。静态、对称、正式摆姿势的图像最难令人信服地动画化,因为模型必须从零创造运动而非继续已暗示的运动。如果源图像是朴素背景前的僵硬头像,即使 Kling 3.0 Pro 也会挣扎。考虑先使用图像节点生成更动态的起始图像——例如,使用 FLUX Kontext 将正式头像编辑为更自然的姿势,然后再输入视频节点。
这是图像转视频中最常见也最昂贵的错误:重新描述已经可见的内容。Kling 3.0 已经看到了你的图像——每个像素、每种颜色、每个细节。你的提示词应该是 100% 运动方向,0% 场景描述。好:"她眨眼,头向左倾斜,浮现温暖的微笑。头发在微风中轻轻摇摆。静止镜头。"差:"花园里一位穿蓝色裙子的美丽棕发女人在阳光下温暖地微笑。"当你重新描述场景时,你在与模型已经看到的内容竞争,这可能导致它试图"调和"你的文字描述和视觉——导致颜色偏移、细节变化,或模型微妙地改变图像以匹配你的文字,而非仅在已有内容上添加运动。规则很简单:只用动词。主体做什么?镜头怎么动?除此之外什么都不要。
标准(每秒 19 积分)和 Pro(每秒 25 积分)之间的质量差距专门在于人物渲染。标准档位可能产生蜡感皮肤、僵硬表情或抖动的嘴部运动——当观众看脸时这些瑕疵立即可察。Pro 档位以远更高的逼真度处理面部微表情:真诚微笑时微妙的眯眼、自然的眨眼节奏(不是机械的开/关)、表情变化时眉毛的轻微运动。对于风景、自然场景、抽象艺术或任何没有人脸的图像,标准产生的结果与 Pro 视觉上无法区分——30% 的成本节省(每 5 秒 95 vs 125 积分)是值得的。决策很简单:画面中有人脸吗?如果有,Pro。如果没有,Standard。
每个图像转视频提示词都应包含明确的镜头指令,即使指令是"静止镜头"。没有镜头方向时,Kling 3.0 可能添加自己的镜头运动——有时有效,有时分散注意力。"静止镜头"将所有注意力集中在主体运动上,最适合肖像动画和特写。"缓慢前推"通过逐渐靠近主体创造亲近感——对情感内容有效。"轻柔环绕"揭示深度和维度——适合产品图像或建筑照片。"后拉"创建围绕主体的戏剧性背景揭示。关键洞察:当你指定镜头运动时,Kling 3.0 在前景和背景层之间创建自然视差,意味着对风景照片的简单"缓慢前推"从平面图像创建 3D 深度效果。这个视差效果不错但不如 Ray 2 明显——如果镜头运动是你的主要目标,Ray 2(540p 120 积分,720p 190 积分)产生更有电影感的镜头物理。
风景动画——这个提示词完美展示了纯运动规则。注意零场景描述:没有提及海滩、海洋、天空颜色、沙滩纹理或时间。100% 是运动方向:海浪拍打(水运动)、泡沫扩散(表面运动)、鸟儿滑翔(空中运动)、镜头前推(观众运动)。四个不同的运动向量从一张可能是静态的照片创建丰富的分层动画。Kling 3.0 标准(5 秒 95 积分)在这里很理想——没有人脸意味着不需要 Pro 档位。
The waves gently crash on the shore, foam spreading across the sand, seabirds glide overhead. Slow subtle camera push forward.
肖像动画——微妙、自然的运动对肖像照片效果最好。这个提示词要求三个微运动(眨眼、头部倾斜、微笑)加一个环境运动(微风中的头发),都是低强度。要求静态肖像照片产生剧烈动作(跳跃、奔跑、跳舞)会看起来不自然,因为模型必须创造源图像中不存在的身体姿态。将运动强度匹配到源图像所暗示的程度。"静止镜头"指令至关重要——没有它,模型可能添加缓慢缩放或平移与微妙的面部动画竞争。
She blinks naturally and tilts her head slightly, a warm smile crosses her face. Hair moves gently in a light breeze. Static camera.
图像转视频提示词的第一规则:描述运动,而非场景。如果你的提示词提到颜色、背景、服装或主体的外观,你在与模型已经看到的图像竞争——导致调和瑕疵。只用动词和镜头方向。
标准档位每秒 19 积分,每个 5 秒片段 95 积分;Pro 每秒 25 积分,125 积分。30 积分的差异只对人脸值得。对于一批 10 个风景动画,标准节省 300 积分(950 vs 1,250),无可见质量损失。
Pro 档位不仅改善人脸——它为自己买单。你通常会重新生成标准结果 3-4 次试图获得自然面部表情(浪费 285-380 积分),然后还是切换到 Pro。对面部动画从 Pro 开始在实践中更便宜,尽管每个片段成本更高。
始终指定明确的镜头方向。"静止镜头"是一个有效且重要的指令——它告诉模型保持画面锁定,所有运动来自主体。没有任何镜头指令时,Kling 3.0 默认添加自己的镜头运动,对肖像工作可能分散注意力。
Kling 3.0 从源图像生成 5 秒片段。标准档位(每秒 19 积分,每片段 95 积分)是 Martini 上最实惠的图像转视频选项之一——比 Seedance 2.0 标准(每秒 20 积分)便宜,远比 Ray 2(根据分辨率 120-320 积分)便宜。Pro 档位(每秒 25 积分,每片段 125 积分)在添加最自然人体运动的同时保持对原始图像最高的保真度。Kling 3.0 与其他动画图像模型的选择取决于画面中的内容:人物 → Kling 3.0 Pro(无与伦比的面部表情),镜头工作 → Ray 2(带电影颗粒的推轨和环绕),戏剧性动作或插画 → Seedance 2.0(高能量运动,动漫/插画专长)。在制作工作流中,许多创作者在 Kling Standard(95 积分)中草拟测试运动方向,然后在 Kling Pro(125 积分)中定稿人物主体,或切换到 Ray 2(720p 190 积分)处理需要电影镜头物理的风景。
在 Martini 的无限画布上将 Kling 3.0 与其他 AI 模型连接使用。无需 GPU,免费开始。
免费开始ByteDance
ByteDance 的 Seedance 2.0 针对戏剧性、高能量图像动画进行了优化——那种 Kling 3.0 可以胜任但 Seedance 处理得尤其出色的动态动作。斗篷飘动、刀剑挥舞、粒子爆炸、环境破坏:Seedance 将这些变成流畅、电影级的片段。模型提供分层成本结构:Fast 每秒 10 积分(5 秒片段 = 50 积分),Standard 每秒 20 积分(5 秒 = 100 积分),Pro 每个 5 秒片段固定 25 积分。支持 6 种纵横比,包括 21:9 超宽屏,同时支持图像转视频和文本转视频。Omni Pro 变体额外支持视频转视频和参考图像以获得更多控制。
查看教程Luma
Luma Ray 2 是 Martini 上镜头驱动图像动画的专家。Kling 3.0 擅长移动主体(人物、物体),而 Ray 2 擅长移动镜头——产生流畅的推轨、环绕、变焦和平移,感觉像真实的摄影师工作而非数字特效。它还添加了独特的电影质感(自然颗粒、电影调色),这是其他模型无法复制的。Ray 2 使用基于分辨率的定价模型:540p 每个 5 秒片段 120 积分,720p 为 190 积分,1080p 为 320 积分。预算选项 Ray Flash 2 以 540p 生成,每个 5 秒片段 75 积分——测试镜头角度比正式渲染便宜约 40%。
查看教程