使用合作伙伴模型生成语音

上次更新日期: 2025年10月27日

了解如何使用合作伙伴模型生成具有不同声音、语调和口音的音频片段。

在应用程序中试用
只需几个简单的步骤,即可根据文本生成语音。

借助生成语音 (beta) 功能,您可以使用合作伙伴模型生成音频片段,从而快速创作自然的配音。通过调整语音生成的核心功能(如速度和稳定性),您可以设置不同的声音和音调。

Firefly 主页上,从左侧面板选择生成,然后选择生成语音 (beta)

生成语音页面上,复制并粘贴要转化为语音的文本,或选择添加文本并上传 DOCX 或 TXT 格式的文件。

添加文本后,导航到左侧的语音设置面板,使用模型下拉菜单选择 ElevenLabs Multilingual v2

注意:

您也可以使用 Firefly Speech 模型创建音频片段。 

使用语音下拉菜单并选择一个语音。

Firefly 上的文本转语音窗口显示语音设置面板,并突出显示语音下拉菜单。
选择最适合您项目需求并符合您创意目标的声音。

您可以通过更改速度、稳定性、风格、夸张程度和其他常规设置来赋予所选声音特色。

  • 速度:向右拖动速度条可以增加生成音频的速度,向左拖动则可以降低速度。
  • 稳定性:向右拖动稳定性条可以增加生成音频的稳定性,向左拖动则可以降低稳定性。
  • 相似度:向右拖动相似度条可以增加与所选声音音频的相似度,向左拖动则可以降低相似度。
  • 风格夸张:向右拖动风格夸张条可以增加对所选音频风格的遵循程度,向左拖动则可以降低。
  • 说话者增强:打开说话者增强选项可以提高合成声音和语音的相似度。
提示:
  • 导航到左侧面板底部,选择图标以播放您所选声音的示例音频并调整控制。
  • 您也可以通过选择图标将声音添加到收藏夹。

在主文本编辑器窗口中,您可以对输入的文本进行其他编辑:

  • 播放:在生成之前预览已上传内容中的选定文本。
文本转语音界面显示文本编辑器窗口,突出显示播放按钮以预览语音输出。
使用播放按钮快速预览文本在所选语音设置下的声音效果。

  • 修正发音:修正发音并添加关于某些词语应该如何发音的额外指导。
  • 查找和替换:选择单词并替换它们。
  • 添加文本:通过导入 TXT 或 DOCX 文件向上传的内容添加额外文本。
  • 添加停顿:添加停顿使音频轨道听起来更自然。
  • 添加语气:添加语调到您的音频中并定义生成语音的语调。

选择生成

当您对生成的效果和声音感到满意时,选择下载以 WAV 或 MP3 格式保存音频文件的副本。