Fish Audio
Fish Audio S2-Pro 是文字转语音模型,而非专用音效生成器——其核心工作是带方括号提示和多说话人对话的富表现力语音合成。纯拟音(呼啸转场、冲击音、环境室内音、UI 反馈),ElevenLabs Sound Effects v2 是正确的工具,因为它是为该界面构建的。Fish Audio S2-Pro 在同一画布上扮演互补角色:它处理声音驱动的声音设计——通过方括号提示如 [exhausted sigh]、[sharp gasp]、[nervous chuckle]、[exhausted breathing] 处理角色发声如呼噜、叹息、喘息、呼吸、笑声和哭声效果。视频同时需要真实拟音(关门、环境床)和人声 SFX(角色的喘息、跑者的呼吸),使用 ElevenLabs SFX v2 处理拟音提示,Fish Audio S2-Pro 处理声音提示,两者都附加到同一画布时间线。
在选模型之前将视频的 SFX 提示分为两个桶。桶 1(拟音):关门、玻璃破碎、脚步、机械、天气、环境床、UI 点击——这些是非声音环境声音,路由到 ElevenLabs Sound Effects v2。桶 2(声音 SFX):角色的喘息、跑者沉重的呼吸、沮丧的叹息、惊吓的尖叫、疲惫的呼气——这些是人声提示,路由到 Fish Audio S2-Pro,在音频节点内使用纯方括号提示词。拆分很重要,因为每个模型为其桶构建;用 SFX v2 处理"沮丧的叹息"产生通用叹息,而用 Fish Audio 加 [frustrated exhausted sigh] 产生与特定角色声音绑定的叹息。
Fish Audio S2-Pro 声音 SFX 继承所选声音的特征。深沉男声(克隆叙述者)的喘息听起来与年轻女声(预制富表现力)的喘息不同。先选声音——通常你重用已为同一场景对话选派的角色声音。叙事内声音 SFX(屏幕上角色反应),使用该角色既定的声音。屏幕外声音 SFX(通用人群反应、未见的尖叫),使用不同声音或克隆的背景声音,这样不会从屏幕上的角色拉走焦点。如果你克隆了声音,声音同意在此也适用。
声音 SFX 提示词是纯方括号的,无口语词。例子:[sharp gasp]、[exhausted breathing for 5 seconds]、[nervous chuckle]、[startled scream then silence]、[panting after running, slow recovery]。模型将方括号解读为整个声音表演,无需周围句子。这与 Fish Audio 的正常对话用法不同,那里方括号指导口语行的演绎。跑步后喘气提示,将纯方括号提示词放在自己的音频节点上,生成,听,然后在画布时间线上附加到追逐场景的动作后恢复节拍。
带追逐时刻的场景通常需要三个 SFX 层:环境床(ElevenLabs SFX v2 的小巷回声)、拟音(SFX v2 的奔跑脚步)、声音 SFX(Fish Audio S2-Pro 的喘气恢复),以及随之而来的口语对话(Fish Audio S2-Pro 对话模式或 ElevenLabs Dialogue v3)。将每个放在自己的音频节点上并对齐到时间线。Martini 画布处理分层;最终交付你可以导出单个音频混合或单独 stem 交给混音师。注意:Fish Audio 在 Martini 中目前是 SEO 定位的——生产运行时取决于工作区配置。如果 Fish Audio 未连接用于声音 SFX,ElevenLabs Eleven v3 与纯方括号提示词(例如,作为独立的 [gasp])是后备,尽管标签覆盖更窄。
追逐场景恢复节拍的声音 SFX 提示词——在方括号内描述时间和强度。使用与该场景对话相同的角色声音以获得叙事内连续性。
[panting after running, heavy chest, slow recovery over 5 seconds]
惊悚或恐怖跳剪的反应 SFX——纯方括号提示词,无周围口语词。放在视觉揭示落地的帧上。
[sharp startled gasp then sudden silence, female voice]
Fish Audio S2-Pro 是 TTS 模型,而非拟音生成器。仅用于声音 SFX(喘息、叹息、呼吸、笑声、尖叫),并将关门、环境床、UI 声音路由到 ElevenLabs Sound Effects v2。
声音 SFX 提示词是纯方括号的——提示周围无口语词。方括号是整个表演:[sharp gasp]、[exhausted breathing 5 seconds]、[nervous chuckle]。
在提示之前选择声音。叙事内声音 SFX 继承角色声音;屏幕外反应应使用不同声音,这样不会拉走焦点。
在同一画布时间线上将 Fish Audio 声音 SFX 与 ElevenLabs Sound Effects v2 拟音配对。每个模型处理其构建的桶——拟音 vs 声音——画布保持所有提示对齐。
声音同意对声音 SFX 也很重要。如果你为角色对话克隆了声音,同样的同意适用于用该声音生成的声音 SFX。
Fish Audio S2-Pro 是 Martini 上 ElevenLabs Sound Effects v2 的声音 SFX 互补。用它处理继承所选角色声音的角色喘息、呼吸、叹息、笑声和类似的人声提示;将拟音(门、环境、脚步、UI)路由到同一画布上的 SFX v2。Martini 画布时间线接受两个模型的输出并将它们对齐到视频,因此 30-60 秒剪辑可以分层环境床(SFX v2)+ 拟音(SFX v2)+ 声音 SFX(Fish Audio)+ 对话(Dialogue v3 或 Fish Audio 对话)而无需离开工作区。纯拟音工作或精致度最重要的纯英语项目,端到端使用 ElevenLabs。多语言场景或声音 SFX 应匹配先前克隆的角色声音,Fish Audio 特别用于声音提示是正确的节点。
在 Martini 的无限画布上将 Fish Audio S2-Pro 与其他 AI 模型连接使用。无需 GPU,免费开始。
免费开始