Generera tal med partnermodeller

Senast uppdaterad den 27 okt. 2025

Lär dig hur du använder partnermodeller för att generera ljudklipp med olika röster, toner och accenter.

Prova i appen
Generera tal från text med några enkla steg.

Med Generera tal (beta), kan du generera ljudklipp med hjälp av partnermodeller för att snabbt skapa naturligt klingande röster. Du kan ställa in olika röster och tonaliteter genom att justera grundläggande funktioner för talgenereringen, som hastighet och stabilitet.

Firefly-hemsidan, välj generera från vänster panel och sedan Generera tal (beta).

På sidan Generera tal, kopiera och klistra in texten du vill omvandla till tal eller välj Lägg till text och ladda upp en fil i DOCX- eller TXT-format.

Efter att du lagt till texten, gå till panelen Talinställningar till vänster och använd listrutan Modell för att välja ElevenLabs Multilingual v2.

Obs!

Du kan också skapa ljudklipp med hjälp av modellen Firefly Speech

Använd rullgardinsmenyn Röst och välj en röst.

Text till tal-fönstret i Firefly visar panelen Talinställningar med en markering över listrutan Röst.
Välj den röst som bäst passar ditt projekts krav och stämmer överens med dina kreativa mål.

Du kan ge den valda rösten karaktär genom att ändra dess hastighet, stabilitet, stil, överdrift och andra allmänna inställningar.

  • Hastighet: Dra reglaget Hastighet åt höger för att öka eller åt vänster för att minska hastigheten på det genererade ljudet.
  • Stabilitet: Dra reglaget Stabilitet åt höger för att öka eller åt vänster för att minska stabiliteten på det genererade ljudet.
  • Likhet: Dra reglaget Likhet åt höger för att öka eller åt vänster för att minska likheten med det valda röstljudet.
  • Överdriven stil: Dra reglaget Överdriven stil åt höger för att öka eller åt vänster för att minska till vilken grad den valda ljudstilen ska följas.
  • Förbättring av talare: Aktivera alternativet Förbättring av talare för att öka likheten mellan den syntetiserade rösten och talet.
Tips!
  • Gå till botten av vänster panel och välj ikonen för att spela upp ett ljudexempel på rösten du har valt och justerat kontrollerna.
  • Du kan också lägga till rösten i dina favoriter genom att välja ikonen.

I huvudtextredigeringsfönstret kan du göra ytterligare ändringar i den inmatade texten:

  • Spela upp: Förhandsgranska markerad text i ditt överförda innehåll innan du genererar det.
Text till tal-skärmen visar textredigerarfönstret med uppspelningsknappen markerad för att förhandsgranska röstutdata.
Använd uppspelningsknappen för att snabbt förhandsgranska hur texten låter med de valda röstinställningarna.

  • Korrigera uttal: Korrigera uttal och lägg till ytterligare vägledning om hur vissa ord ska låta.
  • Sök och ersätt: Markera ord och ersätt dem.
  • Lägg till text: Lägg till ytterligare text till det uppladdade innehållet genom att importera en TXT- eller DOCX-fil.
  • Lägg till paus: Lägg till pauser för att få ljudspåret att låta mer naturligt.
  • Lägg till ton: Lägg till tonalitet till ditt ljud och definiera intonationen i det genererade talet.

Välj Generera.

När du är nöjd med genereringen och hur det låter, välj Hämta för att spara en kopia av ljudfilen i WAV- eller MP3-format.