2 个模型可选
视频剪辑师在一段 AI 生成的成片上叠加 whoosh、冲击声、环境声和 UI 音效,让它不再像无声草稿。在 Martini 画布上,把锁定画面送进 Hunyuan Foley 做视频转拟音,或用具体提示词喂给 ElevenLabs Sound Effects v2(如"近距离金属门撞击,狭窄混凝土走廊,短混响")。在下面叠一个 Minimax Music 的环境音床,全部混到时间线再 NLE 导出。选择下方模型走完一段 30-60 秒产品或叙事视频的最后声音处理流程。
ElevenLabs
ElevenLabs Sound Effects v2 从文本提示词生成无版权费音效——呼啸转场、冲击音、环境室内音、UI 反馈声、脚步声、关门声、雨声、机械声。每个提示词返回 4 个变体片段,让你选择适合帧的版本,然后吸附到视频时间线。模型使用官方 eleven_text_to_sound_v2 端点,意味着具体的提示词("close metallic door slam in narrow concrete hallway, short reverb")远胜模糊的("door sound")。在 Martini 上,SFX 节点直接附加到视频时间线段,因此视频编辑器可以在不离开画布的情况下在 AI 生成的剪辑上铺设拟音。4 变体网格是承重 UX——生成、听、选、吸附到帧。
Fish Audio
Fish Audio S2-Pro 是文字转语音模型,而非专用音效生成器——其核心工作是带方括号提示和多说话人对话的富表现力语音合成。纯拟音(呼啸转场、冲击音、环境室内音、UI 反馈),ElevenLabs Sound Effects v2 是正确的工具,因为它是为该界面构建的。Fish Audio S2-Pro 在同一画布上扮演互补角色:它处理声音驱动的声音设计——通过方括号提示如 [exhausted sigh]、[sharp gasp]、[nervous chuckle]、[exhausted breathing] 处理角色发声如呼噜、叹息、喘息、呼吸、笑声和哭声效果。视频同时需要真实拟音(关门、环境床)和人声 SFX(角色的喘息、跑者的呼吸),使用 ElevenLabs SFX v2 处理拟音提示,Fish Audio S2-Pro 处理声音提示,两者都附加到同一画布时间线。