ElevenLabs AI 音频 - ElevenLabs

ElevenLabs

ElevenLabs 是领先的 AI 语音模型系列，覆盖富表现力文字转语音、多语言旁白、多人对话、声音设计和文本生成音效。在 Martini 上，可在节点式音频工作流中使用 Eleven v3、Multilingual v2、Turbo v2.5、Dialogue v3 和 Sound Effects v2。

Eleven v3 是 ElevenLabs 当前最新的高表现力语音合成模型，面向情绪化演绎、内联音频标签以及覆盖 70 多种语言的自然多人对话。Multilingual v2 仍然适合长篇旁白、企业配音、在线课程以及更重视一致性的项目。Flash v2.5 是 ElevenLabs 当前推荐的低延迟选择，但 Martini 保留 Turbo v2.5 以兼容已有工作流；ElevenLabs 表示 Turbo v2.5 与 Flash v2.5 功能等价，只是 Flash 通常延迟更低。Sound Effects v2 使用官方 eleven_text_to_sound_v2 模型生成转场声、环境声、UI 声、冲击声、无缝循环和制作细节音效。在 Martini 上，这些音频节点可以与视频、图像和脚本节点连接，让创作者在同一个生产图中完成脚本、旁白、音效和后续视频制作。

免费试用 ElevenLabs

ElevenLabs 变体

变体	说明
ElevenLabs TTS Eleven v3	通过 provider 模型 eleven_v3 提供高表现力 TTS，支持音频标签、情绪化演绎、70 多种语言，单次请求上限 5,000 字符。
ElevenLabs Dialogue Eleven v3	多人对话模式，适合自然会话、角色讨论、戏剧化朗读和脚本对话。
ElevenLabs TTS Multilingual v2	稳定高质量的多语言 TTS，适合旁白、在线课程、企业视频和长音频，支持 29 种语言。
ElevenLabs TTS Turbo v2.5	为现有工作流保留的低延迟多语言 TTS；Flash v2.5 是 ElevenLabs 当前更新的低延迟推荐。
ElevenLabs Sound Effects v2	通过 eleven_text_to_sound_v2 文本生成音效，适合环境声、冲击声、转场、UI 反馈、循环和电影层次。

支持的功能

文本转语音

多人对话

音效生成

声音克隆

音乐生成

多语言

最适合

带情绪指导的角色配音
多人对话、脚本场景和音频剧
重视声音一致性的长篇旁白
兼容现有 Turbo 工作流的快速多语言语音生成
面向视频、游戏和社交短片的文本生成音效

优势

Eleven v3 支持用于情绪、演绎方向和非语言反应的内联标签，例如笑声或叹气
Eleven v3 对话工作流支持自然的多人对话
Multilingual v2 适合稳定长篇旁白和数字较多的内容
声音生态丰富，包含声音克隆、声音设计和大量预制声音
Sound Effects v2 覆盖旁白以外的制作音频需求

局限性

Eleven v3 的一致性波动和延迟高于 v2.5 或 Flash 模型，因此不适合作为实时语音代理的首选
对于新的低延迟场景，ElevenLabs 当前更推荐 Flash v2.5 而不是 Turbo v2.5
Eleven v3 单次请求字符上限低于 Multilingual v2 或 Flash v2.5，长内容可能需要分段
音效质量高度依赖提示词是否具体描述时间、质感、强度和环境

使用技巧

需要表演质量时使用 Eleven v3：在需要影响的词句附近加入简短标签，例如 [whispers]、[laughs]、[sighs] 或 [excited]。

有声书、品牌旁白、培训视频和更长文本请优先使用 Multilingual v2，以获得更稳定的演绎。

Turbo v2.5 适合兼容现有 Martini 工作流；如果在 Martini 外构建新的实时语音产品，应优先评估 Flash v2.5。

做对话时，清晰写出每个说话人的轮次；情绪标签越局部、越克制，效果通常越可控。

做音效时，描述声源、动作、空间、距离和强度："close metallic door slam in a narrow concrete hallway, short reverb" 比 "door sound" 更有效。

在 Martini 上使用 ElevenLabs

在 Martini 的无限画布上将 ElevenLabs 与视频、图像、脚本和音乐节点连接使用。无需 GPU，免费开始。

免费开始

常见问题

在 Martini 上应该用哪个 ElevenLabs 模型？

需要高表现力表演和多人对话时用 Eleven v3；稳定长篇旁白用 Multilingual v2；需要兼容现有低延迟 Martini 工作流时用 Turbo v2.5；非语音制作音频使用 Sound Effects v2。

Eleven v3 支持情绪标签和多人说话吗？

支持。Eleven v3 支持用于情绪、演绎和非语言反应的内联音频标签，ElevenLabs 也提供用于自然多人音频的对话端点。

Turbo v2.5 还是 ElevenLabs 最新的低延迟模型吗？

不是。ElevenLabs 当前更推荐 Flash v2.5 用于新的低延迟场景，因为 Flash 通常延迟更低。Martini 保留 Turbo v2.5 是为了兼容已有工作流。

操作指南

ElevenLabs 变体

变体	说明
ElevenLabs TTS Eleven v3	通过 provider 模型 eleven_v3 提供高表现力 TTS，支持音频标签、情绪化演绎、70 多种语言，单次请求上限 5,000 字符。
ElevenLabs Dialogue Eleven v3	多人对话模式，适合自然会话、角色讨论、戏剧化朗读和脚本对话。
ElevenLabs TTS Multilingual v2	稳定高质量的多语言 TTS，适合旁白、在线课程、企业视频和长音频，支持 29 种语言。
ElevenLabs TTS Turbo v2.5	为现有工作流保留的低延迟多语言 TTS；Flash v2.5 是 ElevenLabs 当前更新的低延迟推荐。
ElevenLabs Sound Effects v2	通过 eleven_text_to_sound_v2 文本生成音效，适合环境声、冲击声、转场、UI 反馈、循环和电影层次。

支持的功能

文本转语音

多人对话

音效生成

声音克隆

音乐生成

多语言

最适合

带情绪指导的角色配音
多人对话、脚本场景和音频剧
重视声音一致性的长篇旁白
兼容现有 Turbo 工作流的快速多语言语音生成
面向视频、游戏和社交短片的文本生成音效

优势

Eleven v3 支持用于情绪、演绎方向和非语言反应的内联标签，例如笑声或叹气
Eleven v3 对话工作流支持自然的多人对话
Multilingual v2 适合稳定长篇旁白和数字较多的内容
声音生态丰富，包含声音克隆、声音设计和大量预制声音
Sound Effects v2 覆盖旁白以外的制作音频需求

局限性

Eleven v3 的一致性波动和延迟高于 v2.5 或 Flash 模型，因此不适合作为实时语音代理的首选
对于新的低延迟场景，ElevenLabs 当前更推荐 Flash v2.5 而不是 Turbo v2.5
Eleven v3 单次请求字符上限低于 Multilingual v2 或 Flash v2.5，长内容可能需要分段
音效质量高度依赖提示词是否具体描述时间、质感、强度和环境

使用技巧

需要表演质量时使用 Eleven v3：在需要影响的词句附近加入简短标签，例如 [whispers]、[laughs]、[sighs] 或 [excited]。

有声书、品牌旁白、培训视频和更长文本请优先使用 Multilingual v2，以获得更稳定的演绎。

Turbo v2.5 适合兼容现有 Martini 工作流；如果在 Martini 外构建新的实时语音产品，应优先评估 Flash v2.5。

做对话时，清晰写出每个说话人的轮次；情绪标签越局部、越克制，效果通常越可控。

做音效时，描述声源、动作、空间、距离和强度："close metallic door slam in a narrow concrete hallway, short reverb" 比 "door sound" 更有效。

在 Martini 上使用 ElevenLabs

在 Martini 的无限画布上将 ElevenLabs 与视频、图像、脚本和音乐节点连接使用。无需 GPU，免费开始。

免费开始

常见问题

在 Martini 上应该用哪个 ElevenLabs 模型？

Eleven v3 支持情绪标签和多人说话吗？

支持。Eleven v3 支持用于情绪、演绎和非语言反应的内联音频标签，ElevenLabs 也提供用于自然多人音频的对话端点。

Turbo v2.5 还是 ElevenLabs 最新的低延迟模型吗？

不是。ElevenLabs 当前更推荐 Flash v2.5 用于新的低延迟场景，因为 Flash 通常延迟更低。Martini 保留 Turbo v2.5 是为了兼容已有工作流。

ElevenLabs

ElevenLabs 变体

支持的功能

最适合

优势

局限性

使用技巧

在 Martini 上使用 ElevenLabs

常见问题

相关功能

操作指南

延伸阅读

相关音频模型

Fish Audio S2

本网站使用 Cookie

ElevenLabs

ElevenLabs 变体

支持的功能

最适合

优势

局限性

使用技巧

在 Martini 上使用 ElevenLabs

常见问题

相关功能

操作指南

延伸阅读

相关音频模型

Fish Audio S2