パートナーモデルを使用した音声の生成

最終更新日 : 2025年10月27日

パートナーモデルを使用して、様々な声、トーン、アクセントのオーディオクリップを生成する方法を学びましょう。

アプリで試す
簡単な手順で、テキストから音声を生成します。

音声生成(Beta)では、パートナーモデルを使用してオーディオクリップを生成し、自然な音声ナレーションを素早く作成できます。速度や安定性など、音声生成の主要な機能を調整することで、様々な声やトーンを設定できます。

Firefly ホームページで、左パネルから「生成」を選択し、次に「音声生成(Beta)」を選択します。

音声生成ページで、音声に変換したいテキストをコピーして貼り付けるか、テキストを追加を選択して DOCX または TXT 形式のファイルをアップロードします。

テキストの追加後、左側の音声設定パネルに移動し、モデルドロップダウンを使用して「ElevenLabs Multilingual v2」を選択します。

注意:

Firefly Speech モデルを使用してオーディオクリップを作成することもできます。 

音声ドロップダウンメニューを使用して、音声を選択します。

Firefly のテキスト読み上げウィンドウには、Voice ドロップダウンメニューがハイライト表示された Speech settings パネルが表示されます。
プロジェクトの要件に最適で、クリエイティブな目標に合った音声を選択します。

速度、安定性、スタイル、誇張などの一般設定を変更することで、選択した音声を特徴づけることができます。

  • 速度速度バーを右にドラッグすると、生成される音声の速度が上がり、左にドラッグすると下がります。
  • 安定性安定性バーを右にドラッグすると、生成される音声の安定性が上がり、左にドラッグすると下がります。
  • 類似性類似性バーを右にドラッグすると、選択した音声への類似性が上がり、左にドラッグすると下がります。
  • スタイル誇張スタイル誇張バーを右にドラッグすると、選択したオーディオスタイルへの忠実度が上がり、左にドラッグすると下がります。
  • スピーカー音量を増幅:「スピーカー音量を増幅」オプションをオンにすると、合成音声との類似性が高まります。
ヒント :
  • 左パネルの下部に移動し、アイコンを選択して、選択した音声のサンプルオーディオを再生し、コントロールを調整します。
  • アイコンを選択して、音声をお気に入りに追加することもできます。

メインのテキストエディターウィンドウでは、入力したテキストに追加の編集を加えることができます:

  • 再生:生成する前に、アップロードしたコンテンツで選択したテキストをプレビューします。
テキスト読み上げ画面にテキストエディターウィンドウが表示され、音声出力をプレビューするための再生ボタンがハイライト表示されています。
再生ボタンを使用して、選択した音声設定でテキストがどのように聞こえるかを素早くプレビューできます。

  • 発音の修正: 発音を修正し、特定の単語の発音方法に関する追加のガイダンスを提供します。
  • 検索と置換:単語を選択して置換します。
  • テキストの追加:TXT ファイルまたは DOCX ファイルを読み込み、アップロードしたコンテンツにテキストを追加します。
  • ポーズの追加: オーディオトラックをより自然に聞こえるようにポーズを追加します。
  • トーンの追加:オーディオにトーンを追加して、生成される音声のイントネーションを定義します。

生成」を選択します。

生成された音声に満足したら、「ダウンロード」を選択して、WAV または MP3 形式でオーディオファイルのコピーを保存します。