Generowanie mowy na podstawie tekstu

Ostatnia aktualizacja 27 paź 2025

Dowiedz się, jak używać poleceń tekstowych do generowania klipów audio o różnych głosach, tonach i akcentach za pomocą Firefly.

Wypróbuj w aplikacji
Generuj mowę z tekstu w kilku prostych krokach.

Funkcja Generuj mowę (beta) umożliwia generowanie naturalnie brzmiących klipów audio i narracji. Możesz użyć kontrolek takich jak akcent, język, prędkość i wysokość tonu, aby dostosować charakterystykę głosu do swoich potrzeb.

Na stronie głównej Firefly wybierz opcję Generuj z lewego panelu, a następnie opcję Generuj mowę.

Na stronie Generuj mowę skopiuj i wklej tekst do przekształcenia w mowę lub wybierz opcję Dodaj tekst i prześlij plik w formacie DOCX lub TXT.

Po dodaniu tekstu przejdź do panelu Ustawienia mowy po lewej stronie i użyj rozwijanej listy Model, aby wybrać Firefly Speech.

Wskazówka:

Możesz także użyć modelu partnerskiego, takiego jak ElevenLabs Multilingual v2, do generowania mowy z tekstu.

Użyj menu rozwijanego Głos i wybierz głos.

Użyj tego panelu, aby dostosować akcent, wysokość dźwięku i prędkość, nadając swojemu głosowi niepowtarzalny styl.

Sekcja Ustawienia mowy w lewym panelu wyświetla model Firefly Speech oraz menu rozwijane Głos zawierające listę wszystkich dostępnych głosów.
Wybierz głos, który najlepiej odpowiada wymaganiom Twojego projektu i jest zgodny z Twoimi celami twórczymi.

Uwaga:

Lista głosów załaduje się tylko wtedy, gdy jesteś zalogowany na swoim konto Firefly.

Użyj menu rozwijanego Wybierz język i wybierz język oraz akcent z listy języków, np. angielski (USA), angielski (Wielka Brytania) oraz angielski (Indie).

Sekcja Ustawienia mowy zawiera menu rozwijane Akcent oraz suwaki prędkości i wysokości dźwięku, które służą do dostosowania generowania mowy.
Dostosuj wybrany głos, regulując jego akcent, prędkość i wysokość tonu.

A. Wybierz język B. Prędkość C. Wysokość dźwięku 

Jeśli chcesz zmienić prędkośćwysokość generowanej mowy, dostosuj następujące ustawienia mowy:
  • Prędkość: przesuń suwak prędkości w prawo, aby zwiększyć prędkość odtwarzania, lub w lewo, aby ją zmniejszyć.
  • Wysokość dźwięku: przesuń suwak wysokości dźwięku w prawo, aby zwiększyć wysokość dźwięku, lub w lewo, aby ją zmniejszyć.
Wskazówka:
  • Przejdź do dolnej części lewego panelu i wybierz ikonę , aby odtworzyć próbkę audio wybranego głosu oraz dostosować prędkość, wysokość i akcent.
  • Możesz także dodać głos do ulubionych, wybierając ikonę .

W głównym oknie edytora tekstu możesz wprowadzić dodatkowe zmiany w wprowadzonym tekście:

  • Odtwórz: wyświetl podgląd zaznaczonego tekstu w przesłanej treści przed jej wygenerowaniem.
Strona Generuj mowę wyświetla okno edytora tekstu z podświetlonym przyciskiem Odtwórz umożliwiającym podgląd wyjścia głosowego.
Użyj przycisku odtwarzania, aby szybko odsłuchać, jak tekst brzmi z wybranymi ustawieniami głosu.

  • Popraw wymowę: popraw wymowę i dodaj dodatkowe wskazówki dotyczące wymowy niektórych słów.
  • Znajdź i zamień: wybierz słowa i zamień je.
  • Dodaj tekst: dodaj dodatkowy tekst do przesłanej zawartości, importując plik TXT lub DOCX.
  • Dodaj pauzę: dodaj pauzy, aby ścieżka audio brzmiała bardziej naturalnie.
  • Dodaj ton: dodaj tonację do ścieżki audio i określ intonację generowanej mowy.

Wybierz opcję Generuj.

Gdy będziesz zadowolony z wygenerowanego efektu i jego brzmienia, wybierz Pobierz, aby zapisać kopię pliku audio w formacie WAV lub MP3.