Voice Cloning
Voice Cloning 会基于音频样本创建自定义声音模型,用于个性化的文本转语音生成。
概览
| 属性 | 值 |
|---|---|
| 提供商 | Various |
| 成本 | 100 credits |
| 模态 | Audio |
| 时长 | Variable |
| 需要提示词 | Yes |
最适合做什么
- 自定义音色 — 创建独特的声音模型
- 品牌一致性 — 全内容使用同一声音
- 个性化 — 满足特定声音需求
- 角色声音 — 保持角色一致
- 本地化 — 同一声音说不同语言
输入
Text(必填)
要用克隆声音说出的文本。
连接颜色:🟡 Yellow
Voice Sample(必填)
用于克隆的音频样本(建议 10-30 秒)。
连接颜色:🟠 Orange
配置
Clone Strength
Type: Slider
Range: 0 - 1
Default: 0.8
与原始声音的贴合程度。
Speed
Type: Slider
Range: 0.5 - 2.0
Default: 1.0
Seed
Type: Number
输出
Type:Audio
连接颜色:🟠 Orange
用例
品牌声音
Clone brand spokesperson voice,
maintain consistency across all content,
professional delivery.
角色一致性
Clone character voice for game/animation,
same voice for all dialogue,
consistent personality.
个性化内容
Clone specific voice for personalized messages,
birthday greetings, custom announcements.
Voice Sample Guidelines
| 维度 | 建议 |
|---|---|
| Length | 10-30 seconds |
| Quality | Clear, no noise |
| Content | Natural speech |
| Format | WAV or MP3 |
| Emotion | Match desired output |
提升效果的小建议
- 样本质量要好 — 清晰、无噪声
- 样本一致 — 录音质量尽量一致
- 自然语音 — 尽量避免“朗读腔”
- 调整 strength — 调低通常更自然
- 多样本更好 — 更完整捕捉音色特征
相关模型
- Chatterbox — 快速声音克隆
- XTTS-v2 — 跨语言 TTS
- Dia TTS — 多说话人