Generieren von Sprache aus Text

Zuletzt aktualisiert am 27. Oktober 2025

Erfahre, wie du in Firefly mithilfe von Textbeschreibungen Audioclips mit verschiedenen Stimmen, Tonlagen und Akzenten generierst.

In der App testen
Erstelle in wenigen einfachen Schritten ein Bild aus einer Textbeschreibung.

Mit Sprache generieren (Beta) kannst du natürlich klingende Audioclips und Begleitkommentare generieren. Mit Steuerelementen wie Akzent, Geschwindigkeit und Tonlage kannst du die Eigenschaften der Stimmen an deine Bedürfnisse anpassen.

Wähle auf der Homepage von Firefly im linken Bedienfeld Generieren und dann Sprache generieren aus.

Kopiere den Text, den du in Sprache konvertieren möchtest, und füge ihn auf der Seite Sprache generieren ein. Du kannst auch Text hinzufügen auswählen und eine Datei im DOCX- oder TXT-Format hochladen.

Navigiere nach dem Hinzufügen des Textes zum Bedienfeld Spracheinstellungen auf der linken Seite und wähle im Dropdown-Menü Modell die Option Firefly Speech aus.

Tipp:

Du kannst auch mit einem Partnermodell wie ElevenLabs Multilingual v2 Sprache aus Text generieren.

Wähle im Dropdown-Menü Stimme eine Stimme aus.

Mit diesem Bedienfeld passt du Akzent, Tonlage und Geschwindigkeit an und verleihst deiner Stimme einen einzigartigen Stil.

Im linken Bedienfeld wird im Abschnitt „Spracheinstellungen“ das Firefly Speech-Modell und ein erweitertes Dropdown-Menü „Stimme“ mit allen verfügbaren Stimmen angezeigt.
Wähle die Stimme aus, die am besten zu den Anforderungen des Projekts passt und deinen kreativen Zielen entspricht.

Hinweis:

Die Liste der Stimmen wird nur geladen, wenn du bei deinem Firefly-Konto angemeldet bist.

Wähle im Dropdown-Menü Sprache auswählen in der Liste der Sprachen eine Sprache und den Vortragsakzent aus, zum Beispiel Englisch (US), Englisch (UK) und Englisch (Indien).

Im Abschnitt „Spracheinstellungen“ werden das Dropdown-Menü „Akzent“ und die Regler für Geschwindigkeit und Tonlage angezeigt, um die Sprachgenerierung anzupassen.
Passe die ausgewählte Stimme an, indem du deren Akzent, Geschwindigkeit und Tonlage einstellst.

A. Sprache auswählen B. Geschwindigkeit C. Tonlage 

Wenn du die Geschwindigkeit und die Tonlage der generierten Sprache ändern möchtest, passe die folgenden Spracheinstellungen an:
  • Geschwindigkeit: Ziehe den Geschwindigkeitsregler nach rechts, um die Geschwindigkeit der gesprochenen Audiodatei zu erhöhen, oder nach links, um sie zu verringern.
  • Tonlage: Ziehe den Tonlagenregler nach rechts, um die Tonlage der gesprochenen Audiospur zu erhöhen, oder nach links, um sie zu verringern.
Tipp:
  • Navigiere zum unteren Rand des linken Bedienfelds und wähle das Symbol aus, um ein Audiobeispiel der ausgewählten Stimme mit angepasster Geschwindigkeit, Tonlage und Akzent abzuspielen.
  • Du kannst die Stimme auch zu den Favoriten hinzufügen. Wähle dazu das Symbol aus.

Im Hauptfenster des Texteditors kannst du zusätzliche Änderungen am eingegebenen Text vornehmen:

  • Wiedergabe: Vorschau des ausgewählten Textes in den hochgeladenen Inhalten vor der Generierung.
Auf der Seite „Sprache generieren“ wird das Editor-Fenster angezeigt. Die Schaltfläche „Wiedergabe“ ist hervorgehoben, um eine Vorschau der Sprachausgabe anzuhören.
Mithilfe der Schaltfläche „Wiedergabe“ kannst du schnell ein Audiobeispiel davon erhalten, wie der Text mit den ausgewählten Spracheinstellungen klingt.

  • Aussprache korrigieren: Aussprache korrigieren und zusätzliche Hinweise geben, wie bestimmte Wörter klingen sollen.
  • Suchen & Ersetzen: Wähle Wörter aus und ersetzen sie.
  • Text hinzufügen: Füge dem hochgeladenen Inhalt zusätzlichen Text hinzu, indem du eine TXT- oder DOCX-Datei importierst.
  • Pause einfügen: Pausen einfügen, damit die Audiospur natürlicher klingt.
  • Ton hinzufügen: Tonalität hinzufügen zur Audiospur, um die Betonung der generierten Sprache zu definieren.

Wähle Generieren aus.

Wenn du mit der Generierung und dem Klang zufrieden bist, wähle Download aus, um eine Kopie der Audiodatei im WAV- oder MP3-Format zu speichern.