从文本生成语音

上次更新日期: 2025年11月7日

了解如何在 Firefly 中使用文本提示生成具有不同声音、语调和口音的音频片段。

在应用程序中试用
只需几个简单的步骤,即可根据文本生成语音。

生成语音 (beta) 允许您生成自然的音频片段和配音。 您可以使用口音、语言、速度和音调等控制选项来自定义最适合您需求的语音特征。

Firefly 主页上,从左侧面板选择生成,然后选择生成语音

生成语音页面上,复制并粘贴要转化为语音的文本,或选择从文件导入文本并上传 DOCX 或 TXT 格式的文件。

添加文本后,导航到左侧的语音设置面板,使用模型下拉菜单选择Firefly Speech

提示:

您也可以使用合作伙伴模型,如ElevenLabs Multilingual v2,从文本生成语音。

使用语音下拉菜单选择一个语音。在语音下拉菜单中,您可以调整口音/语言、音调和语速,为您的语音赋予独特的风格。

左侧面板中的语音设置部分显示 Firefly 语音模型和展开的语音下拉菜单,列出所有可用的语音。
选择最适合您项目需求并符合您创意目标的语音。

注意:

只有在登录您的 Firefly 帐户后,语音列表才会加载。

使用选择语言下拉菜单,从语言列表中选择语言和口音,例如英语(美国)英语(印度)

语音设置部分显示口音下拉菜单以及用于调整语音生成的速度和音调滑块。
通过调整口音、速度和音调来自定义所选语音。

A. 选择语言 B. 速度 C. 音高 

如果要更改生成语音的速度音调,请调整以下语音设置:
  • 速度向右拖动速度条可以增加语音速度,向左拖动可以降低语音速度。
  • 音调向右拖动音调条可以提高语音音调,向左拖动可以降低语音音调。
提示:
  • 导航到左侧面板底部,选择图标以播放您已选择并调整了速度、音调和口音的语音示例。
  • 您还可以通过选择图标将语音添加到收藏夹。

在主文本编辑器窗口中,您可以对输入的文本进行其他编辑:

  • 播放:在生成之前预览已上传内容中的选定文本。
生成语音页面显示文本编辑器窗口,并突出显示播放按钮以预览语音输出。
使用播放按钮可以快速预览在所选语音设置下文本的发音效果。

  • 修正发音:修正发音并添加关于某些词语应该如何发音的额外指导。
  • 查找和替换:选择并替换词语。
  • 添加语气:添加语调到您的音频中并定义生成语音的语调。
要向脚本添加更多文本、添加暂停或查看写作提示,请转到生成栏并进行以下选择:
  • 添加文本:通过导入 TXT 或 DOCX 文件向上传的内容添加额外文本。
  • 添加停顿:添加停顿使音频轨道听起来更自然。
  • 显示提示:查看编写提示以生成最佳结果。
“生成语音”页面显示文本编辑器窗口,且“添加文本”按钮在“生成”工具栏中处于高亮显示状态。
将鼠标悬停在菜单项上以了解其功能。

选择生成

当您对生成的效果和声音感到满意时,选择下载即可将音频文件的副本保存在本地设备上。