从文本生成语音

上次更新日期: 2025年10月27日

了解如何在 Firefly 中使用文本提示生成具有不同声音、语调和口音的音频片段。

在应用程序中试用
只需几个简单的步骤,即可根据文本生成语音。

生成语音 (beta) 允许您生成自然的音频片段和配音。您可以使用口音、语言、速度和音调等控制选项来自定义最适合您需求的语音特征。

Firefly 主页上,从左侧面板选择生成,然后选择生成语音

生成语音页面上,复制并粘贴要转化为语音的文本,或选择添加文本并上传 DOCX 或 TXT 格式的文件。

添加文本后,导航到左侧的语音设置面板,使用模型下拉菜单选择 Firefly 语音

提示:

您也可以使用合作伙伴模型,如 ElevenLabs Multilingual v2,从文本生成语音。

使用语音下拉菜单并选择一个语音。

使用此面板调整口音、音调和速度,赋予您的语音独特的风格。

左侧面板中的语音设置部分显示 Firefly 语音模型和展开的语音下拉菜单,列出所有可用的语音。
选择最适合您项目需求并符合您创意目标的语音。

注意:

只有在您登录 Firefly 帐户后,才会加载语音列表。

使用选择语言下拉菜单,从语言列表中选择语言和传递口音,如英语(美国)英语(英国)英语(印度)

语音设置部分显示口音下拉菜单以及用于调整语音生成的速度和音调滑块。
通过调整口音、速度和音调来自定义所选语音。

A. 选择语言 B. 速度 C. 音高 

如果要更改生成语音的速度音调,请调整以下语音设置:
  • 速度向右拖动速度条可以增加语音速度,向左拖动可以降低语音速度。
  • 音调向右拖动音调条可以提高语音音调,向左拖动可以降低语音音调。
提示:
  • 导航到左侧面板底部,选择 图标以播放您所选择的语音示例,并调整其速度、音调和口音。
  • 您还可以通过选择图标将语音添加到收藏夹。

在主文本编辑器窗口中,您可以对输入的文本进行其他编辑:

  • 播放:在生成之前预览已上传内容中的选定文本。
“生成语音”页面显示文本编辑器窗口,并突出显示了“播放”按钮,可用于预览语音输出。
使用播放按钮可以快速预览在所选语音设置下文本的发音效果。

  • 修正发音:修正发音并添加关于某些词语应该如何发音的额外指导。
  • 查找和替换:选择并替换词语。
  • 添加文本:通过导入 TXT 或 DOCX 文件向上传的内容添加额外文本。
  • 添加停顿:添加停顿使音频轨道听起来更自然。
  • 添加语气:添加语调到您的音频中并定义生成语音的语调。

选择生成

当您对生成的效果和声音感到满意时,选择下载以 WAV 或 MP3 格式保存音频文件的副本。