ElevenLabs

如何使用 ElevenLabs TTS Eleven v3 创建 AI 配音

ElevenLabs Eleven v3 在 Martini 上所有 TTS 模型中产生最自然的英语配音。它提供 21 种不同的声音——从温暖的叙述者音调（Rachel、Sarah）到权威的男声（Roger、Brian、Daniel）——每种都具有根据脚本内容自适应的逼真情感语调变化。英语声音质量和情感表现力无可匹敌，而 Minimax Speech 在中文方面仍是更强的选择。ElevenLabs 还提供更快的 Turbo v2.5 变体和用于非英语语言的 Multilingual v2。

免费试用 ElevenLabs TTS Eleven v3

分步指南

为内容类型选择合适的声音

ElevenLabs 提供 21 种声音，每种都有独特的个性。产品旁白和品牌视频试 Rachel（温暖、专业女声）或 Brian（自信、权威男声）。教程和解说试 Sarah（清晰、友好）或 Daniel（平静、教学风格）。讲故事和播客试 Aria（表现力强、多才多艺）或 Callum（引人入胜的男性叙述者）。在投入完整脚本之前用 2-3 种声音生成短测试句子——声音-内容匹配度比任何其他因素对质量影响更大。

为口语表达而非阅读编写脚本

TTS 脚本中最常见的错误是写正式文本，口语时听起来僵硬。用对话方式写：使用缩略形式（"we'll"而非"we will"），更短的句子，自然的过渡（"Now, let's look at..."而非"The following section demonstrates..."）。ElevenLabs v3 处理情感细微差别——如果你想要兴奋，就写得兴奋。如果你想要平静的权威感，就用沉着、陈述性的句子。模型从写作风格推断语气。

用标点控制节奏

标点是你的主要节奏工具。句号在思想之间创建自然停顿。逗号在句子内创建短暂停顿。省略号（...）创建戏剧性或沉思的停顿。破折号（——）创建急促的过渡。段落之间的换行比句号增加稍长的停顿。30 秒广告目标 80-90 个词。教程旁白将节奏减慢到每分钟 120-130 词（约每 30 秒 60 词），使用更多标点断句。

串联到视频制作流程

ElevenLabs 在 Martini 上的真正力量是画布流程：将音频输出直接连接到口型同步节点（OmniHuman 或 Kling LipSync）创建数字人视频，或连接到视频节点将旁白与 AI 生成的视觉配对。这实现了完整的广告制作——脚本 → 配音 → 视频——在单一工作流中完成，无需离开 Martini。

提示词示例

品牌旁白——"designed to last a lifetime"前的省略号创建沉思的停顿，强调价值主张。短的陈述句给声音一种自信、高端的感觉。用 Rachel 或 Brian 尝试不同的品牌个性。

Welcome to our new collection. Each piece is carefully crafted from sustainable materials... designed to last a lifetime. Discover what makes us different.

教程旁白——编号结构（"First... Then... Finally"）给 TTS 自然的节奏标记。"you're all set!"的感叹号信号 ElevenLabs 在结尾添加积极的能量。用 Sarah 或 Daniel 尝试清晰的教学表达。

In this tutorial, we'll walk through three simple steps to set up your account. First, click the sign-up button on the homepage. Then, enter your email and choose a password. Finally, verify your email — and you're all set!

参数技巧

需要更快出片的长篇旁白使用 Turbo v2.5 变体——表现力稍弱但比 Eleven v3 渲染更快。

21 种声音是：Rachel、Aria、Roger、Sarah、Laura、Charlie、George、Callum、River、Liam、Charlotte、Alice、Matilda、Will、Jessica、Eric、Chris、Brian、Daniel、Lily、Bill。始终在投入前测试 2-3 种。

非英语配音使用 ElevenLabs TTS Multilingual v2——它支持 29 种以上语言。中文特别推荐 Minimax Speech 2.5 HD 产生更自然的普通话。

以每分钟 120-150 词编写脚本以获得舒适的听觉速度。60 秒广告应为 120-150 词，而非 200+。

输出预期

ElevenLabs Eleven v3 在 Martini 上产生最接近人类的英语 TTS——情感语调变化、自然呼吸模式和表达性的表达，听起来像专业配音演员而非 AI。与 Minimax Speech 的权衡：ElevenLabs 在英语方面是明确赢家，但 Minimax Speech 2.5 HD 产生更自然的中文（特别是普通话声调准确度）。多语言项目使用 ElevenLabs Multilingual v2 用于西方语言，Minimax 用于中文/亚洲语言。

在 Martini 上使用 ElevenLabs TTS Eleven v3

在 Martini 的无限画布上将 ElevenLabs TTS Eleven v3 与其他 AI 模型连接使用。无需 GPU，免费开始。

免费开始

文档

nodes/audio

其他模型教程

Minimax 2.5

Minimax Speech 2.5 HD

Minimax Speech 2.5 HD 是普通话中文和多语言配音最佳的文本转语音模型。虽然 ElevenLabs 在英语 TTS 中占主导地位，但 Minimax Speech 以西方 TTS 模型无法匹敌的自然度处理中文声调准确度——四声、句子级语调和情感节奏都听起来像母语者而非机器人。模型提供 17 种不同声音，分两个档位（HD 用于交付品质，Turbo 用于更快草稿），与 ElevenLabs 竞争力相当，同时提供更优的中日韩语言支持。

查看教程

如何创建 AI 配音

ElevenLabs

如何使用 ElevenLabs TTS Eleven v3 创建 AI 配音

免费试用 ElevenLabs TTS Eleven v3

分步指南

为内容类型选择合适的声音

为口语表达而非阅读编写脚本

用标点控制节奏

串联到视频制作流程

提示词示例

Welcome to our new collection. Each piece is carefully crafted from sustainable materials... designed to last a lifetime. Discover what makes us different.

参数技巧

需要更快出片的长篇旁白使用 Turbo v2.5 变体——表现力稍弱但比 Eleven v3 渲染更快。

非英语配音使用 ElevenLabs TTS Multilingual v2——它支持 29 种以上语言。中文特别推荐 Minimax Speech 2.5 HD 产生更自然的普通话。

以每分钟 120-150 词编写脚本以获得舒适的听觉速度。60 秒广告应为 120-150 词，而非 200+。

输出预期

在 Martini 上使用 ElevenLabs TTS Eleven v3

在 Martini 的无限画布上将 ElevenLabs TTS Eleven v3 与其他 AI 模型连接使用。无需 GPU，免费开始。

免费开始

文档

nodes/audio

其他模型教程

Minimax 2.5

Minimax Speech 2.5 HD

查看教程

如何创建 AI 配音

如何使用 ElevenLabs TTS Eleven v3 创建 AI 配音

分步指南

为内容类型选择合适的声音

为口语表达而非阅读编写脚本

用标点控制节奏

串联到视频制作流程

提示词示例

参数技巧

输出预期

在 Martini 上使用 ElevenLabs TTS Eleven v3

相关功能

文档

延伸阅读

其他模型教程

Minimax Speech 2.5 HD

本网站使用 Cookie

如何使用 ElevenLabs TTS Eleven v3 创建 AI 配音

分步指南

为内容类型选择合适的声音

为口语表达而非阅读编写脚本

用标点控制节奏

串联到视频制作流程

提示词示例

参数技巧

输出预期

在 Martini 上使用 ElevenLabs TTS Eleven v3

相关功能

文档

延伸阅读

其他模型教程

Minimax Speech 2.5 HD