ElevenLabs
ElevenLabs Sound Effects v2 从文本提示词生成无版权费音效——呼啸转场、冲击音、环境室内音、UI 反馈声、脚步声、关门声、雨声、机械声。每个提示词返回 4 个变体片段,让你选择适合帧的版本,然后吸附到视频时间线。模型使用官方 eleven_text_to_sound_v2 端点,意味着具体的提示词("close metallic door slam in narrow concrete hallway, short reverb")远胜模糊的("door sound")。在 Martini 上,SFX 节点直接附加到视频时间线段,因此视频编辑器可以在不离开画布的情况下在 AI 生成的剪辑上铺设拟音。4 变体网格是承重 UX——生成、听、选、吸附到帧。
在提示之前,决定每个 SFX 在视频时间线上的位置。30 秒产品视频通常需要:开场和产品揭示之间 1 个呼啸转场,关键特性落在屏幕上时 1 个冲击音,对话下运行的 1 个环境室内音,每个显示的交互元素 1 个 UI 声音(点击、叮、滑动)。先在画布时间线上标记这些位置。每个 SFX 附加到特定帧范围——转场和冲击音通常 0.5-3 秒长,环境床 5-30 秒。预先定位让提示更容易,因为你已经知道 SFX 需要做什么。
SFX v2 的单一最大质量控制杆是提示词具体性。5 元素模板有效:声源(什么发出声音)、动作(在做什么)、空间(环境)、距离(近 vs 远)、强度(轻 vs 响)。例子:"close metallic door slam in narrow concrete hallway, short reverb"(门 SFX);"distant thunder rumble in open countryside, long decay, low frequency"(环境转场);"soft mechanical click, dry, no reverb, intimate ASMR distance"(UI 点击)。像"door sound"或"scary ambient"的模糊提示词产生通用结果,因为模型无法消除门的类型、可怕的类型的歧义。像拟音艺术家描述提示一样写提示词。
每个 SFX v2 提示词返回 4 个变体片段。在实际帧位置(而非孤立)连续听四个——单独听起来很棒的呼啸声可能与下面的音乐床冲突。选择支持视觉而非争夺注意力的版本。然后将所选变体吸附到提示应命中的确切帧。Martini 的画布让你在时间线上拖动 SFX 片段;冲击音通常希望其峰值幅度在视觉落地的帧上,而非前后 0.1 秒。对于环境床,循环点比起始更重要——2-3 秒淡入,在对话下保持,剪切处淡出。
精致的 30-60 秒视频通常有 4-8 个 SFX 提示分层,而非 1-2 个。标准分层:环境床(室内音或大气嗡嗡声)在下方运行,转场 SFX(呼啸声、上升音)在剪切处,冲击 SFX(冲击音、撞击)在关键视觉时刻,UI SFX(点击、叮)在元素特定帧上。将每个 SFX 放在自己的音频节点上并附加到目标帧范围。Martini 画布时间线让你无需外部 NLE 即可堆叠和对齐所有提示。最终交付,画布作为单个音频混合或作为单独的 stem 导出——取决于你是按原样发布视频还是交给调色师/声音设计师。
5 元素拟音提示词——声源(金属门)、动作(撞击)、空间(窄混凝土走廊)、距离(近)、强度/特征(锐利、中频)。远胜"门声"。用于硬切转场或场景结束冲击音。
close metallic door slam in narrow concrete hallway, short reverb, sharp impact, mid frequency
环境床提示词——明确描述空间和质感,请求无缝循环长度,让 SFX 在 30 秒场景下分层而无明显重复。将此放在对话下运行的自己的音频节点上。
low rumbling room tone, abandoned warehouse at night, distant air conditioner hum, sparse occasional creak, 30 seconds seamless loop
具体提示词远胜模糊的。每个提示使用 5 元素模板(声源、动作、空间、距离、强度)。"门声"产生通用;"close metallic door slam in narrow concrete hallway, short reverb"产生可用。
每个提示词 4 个变体是承重 UX。在实际帧位置(而非单独)听——单独听起来很棒的可能与下面的音乐冲突。
环境床,明确请求无缝循环长度("30 秒无缝循环"),让模型产生无明显重复的片段。在对话/SFX 提示下分层这个。
精致的 30-60 秒视频的标准提示密度:4-8 个 SFX 提示分层。环境床 + 转场 SFX + 冲击音 + UI 声音。任何更稀疏的感觉像无声草稿。
SFX v2 输出是无版权费的,因此商业使用无需进一步许可。这是与按使用收费的素材库相比的真正差异。
ElevenLabs Sound Effects v2 产生无版权费、提示词驱动的拟音,随提示词具体性扩展。4 变体网格让你选择适合帧的版本;画布时间线让你将每个提示吸附到视觉需要支持的确切时刻。与专用拟音库的权衡:SFX v2 迭代更快且无每次使用许可,但拟音艺术家手工录制的细微特征对于标志性内容仍是提示词驱动生成无法完全匹配的。对于 90% 的社交、产品和教育视频工作——速度和许可灵活性比艺术拟音更重要——SFX v2 是正确的工具。Martini 画布让 SFX 与视频时间线相邻,因此视频编辑器可以在 30-60 秒剪辑中铺设 4-8 个提示而无需离开工作区。
在 Martini 的无限画布上将 ElevenLabs Sound Effects v2 与其他 AI 模型连接使用。无需 GPU,免费开始。
免费开始