Generieren von Sprache mithilfe von Partnermodellen

Zuletzt aktualisiert am 27. Oktober 2025

Erfahre, wie du mithilfe von Partnermodellen Audioclips mit verschiedenen Stimmen, Tonlagen und Akzenten generierst.

In der App testen
Erstelle in wenigen einfachen Schritten ein Bild aus einer Textbeschreibung.

Mit Sprache generieren (Beta), kannst du mithilfe von Partnermodellen Audioclips erstellen, um schnell natürlich klingende Off-Kommentare zu erzeugen. Du kannst verschiedene Stimmen und Tonalitäten einstellen, indem du die Kernfunktionen der Sprachgenerierung wie Geschwindigkeit und Stabilität anpasst.

Wähle auf der Homepage von Firefly im linken Bedienfeld Generieren und dann Sprache generieren (Beta) aus.

Kopiere den Text und füge ihn auf der Seite Sprache generieren ein, den du in Sprache konvertieren möchtest. Du kannst auch Text hinzufügen auswählen und eine Datei im DOCX- oder TXT-Format hochladen.

Navigiere nach dem Hinzufügen des Textes zum Bedienfeld Spracheinstellungen auf der linken Seite und wähle im Dropdown-Menü Modell die Option ElevenLabs Multilingual v2 aus.

Hinweis:

Du kannst Audioclips auch mit dem Firefly Speech-Modell erstellen. 

Wähle im Dropdown-Menü Stimme eine Stimme aus.

In dem Fenster „Text zu Sprache“ in Firefly wird das Bedienfeld „Spracheinstellungen“ mit einer Hervorhebung oberhalb des Dropdown-Menüs „Stimme“ angezeigt.
Wähle die Stimme aus, die am besten zu den Anforderungen des Projekts passt und deinen kreativen Zielen entspricht.

Du kannst der ausgewählten Stimme Charakter verleihen, indem du die Geschwindigkeit, Stabilität, Stil, Übertreibung und andere allgemeine Einstellungen änderst.

  • Geschwindigkeit: Ziehe den Geschwindigkeitsregler nach rechts, um die Geschwindigkeit der generierten Audiospur zu erhöhen, oder nach links, um sie zu verringern.
  • Stabilität: Ziehe den Stabilitätsregler nach rechts, um die Stabilität der gesprochenen Audiospur zu erhöhen, oder nach links, um sie zu verringern.
  • Ähnlichkeit: Ziehe den Ähnlichkeitsregler nach rechts, um die Ähnlichkeit der ausgewählten Audiospur zu erhöhen, oder nach links, um sie zu verringern.
  • Stilübertreibung: Ziehe den Stilübertreibungsregler nach rechts, um die Stilübertreibung der gesprochenen Audiospur zu erhöhen, oder nach links, um sie zu verringern.
  • Sprechendenoptimierung: Aktiviere die Option Sprechendenoptimierung, um die Ähnlichkeit der synthetisierten Stimme und der Sprache zu erhöhen.
Tipp:
  • Navigiere zum unteren Rand des linken Bedienfelds und wähle das Symbol aus, um ein Audiobeispiel der ausgewählten Stimme abzuspielen und die Steuerelemente anzupassen.
  • Du kannst die Stimme auch zu den Favoriten hinzufügen. Wähle dazu Sie das Symbol aus.

Im Hauptfenster des Texteditors kannst du zusätzliche Änderungen am eingegebenen Text vornehmen:

  • Wiedergabe: Vorschau des ausgewählten Texts in den hochgeladenen Inhalten vor der Generierung.
Auf dem Bildschirm „Test zu Sprache“ wird das Texteditor-Fenster angezeigt. Die Schaltfläche „Wiedergabe“ ist hervorgehoben, um eine Vorschau der Sprachausgabe anzuhören.
Mithilfe der Schaltfläche „Wiedergabe“ kannst du schnell eine Vorschau davon erhalten, wie der Text mit den ausgewählten Spracheinstellungen klingt.

  • Aussprache korrigieren: Aussprache korrigieren und zusätzliche Hinweise geben, wie bestimmte Wörter klingen sollen.
  • Suchen & Ersetzen: Wähle Wörter aus und ersetzen sie.
  • Text hinzufügen: Füge dem hochgeladenen Inhalt zusätzlichen Text hinzu, indem du eine TXT- oder DOCX-Datei importierst.
  • Pause einfügen: Pausen einfügen, damit die Audiospur natürlicher klingt.
  • Ton hinzufügen: Tonalität hinzufügen zur Audiospur, um die Betonung der generierten Sprache zu definieren.

Wähle Generieren aus.

Wenn du mit der Generierung und dem Klang zufrieden bist, wähle Download aus, um eine Kopie der Audiodatei im WAV- oder MP3-Format zu speichern.