ElevenLabs
ElevenLabs 是领先的 AI 语音模型系列,覆盖富表现力文字转语音、多语言旁白、多人对话、声音设计和文本生成音效。在 Martini 上,可在节点式音频工作流中使用 Eleven v3、Multilingual v2、Turbo v2.5、Dialogue v3 和 Sound Effects v2。
Eleven v3 是 ElevenLabs 当前最新的高表现力语音合成模型,面向情绪化演绎、内联音频标签以及覆盖 70 多种语言的自然多人对话。Multilingual v2 仍然适合长篇旁白、企业配音、在线课程以及更重视一致性的项目。Flash v2.5 是 ElevenLabs 当前推荐的低延迟选择,但 Martini 保留 Turbo v2.5 以兼容已有工作流;ElevenLabs 表示 Turbo v2.5 与 Flash v2.5 功能等价,只是 Flash 通常延迟更低。Sound Effects v2 使用官方 eleven_text_to_sound_v2 模型生成转场声、环境声、UI 声、冲击声、无缝循环和制作细节音效。在 Martini 上,这些音频节点可以与视频、图像和脚本节点连接,让创作者在同一个生产图中完成脚本、旁白、音效和后续视频制作。
| 变体 | 说明 |
|---|---|
| ElevenLabs TTS Eleven v3 | 通过 provider 模型 eleven_v3 提供高表现力 TTS,支持音频标签、情绪化演绎、70 多种语言,单次请求上限 5,000 字符。 |
| ElevenLabs Dialogue Eleven v3 | 多人对话模式,适合自然会话、角色讨论、戏剧化朗读和脚本对话。 |
| ElevenLabs TTS Multilingual v2 | 稳定高质量的多语言 TTS,适合旁白、在线课程、企业视频和长音频,支持 29 种语言。 |
| ElevenLabs TTS Turbo v2.5 | 为现有工作流保留的低延迟多语言 TTS;Flash v2.5 是 ElevenLabs 当前更新的低延迟推荐。 |
| ElevenLabs Sound Effects v2 | 通过 eleven_text_to_sound_v2 文本生成音效,适合环境声、冲击声、转场、UI 反馈、循环和电影层次。 |
在 Martini 的无限画布上将 ElevenLabs 与视频、图像、脚本和音乐节点连接使用。无需 GPU,免费开始。
免费开始需要高表现力表演和多人对话时用 Eleven v3;稳定长篇旁白用 Multilingual v2;需要兼容现有低延迟 Martini 工作流时用 Turbo v2.5;非语音制作音频使用 Sound Effects v2。
支持。Eleven v3 支持用于情绪、演绎和非语言反应的内联音频标签,ElevenLabs 也提供用于自然多人音频的对话端点。
不是。ElevenLabs 当前更推荐 Flash v2.5 用于新的低延迟场景,因为 Flash 通常延迟更低。Martini 保留 Turbo v2.5 是为了兼容已有工作流。