Generowanie mowy na podstawie tekstu

Ostatnia aktualizacja 7 lis 2025

Dowiedz się, jak używać poleceń tekstowych do generowania klipów audio o różnych głosach, tonach i akcentach za pomocą programu Firefly.

Wypróbuj w aplikacji
Generuj mowę z tekstu w kilku prostych krokach.

Funkcja Generuj mowę (beta) umożliwia generowanie naturalnie brzmiących klipów audio i narracji.Możesz użyć elementów sterujących takich jak akcent, język, prędkość i wysokość tonu, aby dostosować charakterystykę głosu do swoich potrzeb.

Na stronie głównej Firefly wybierz opcję Generuj z lewego panelu, a następnie opcję Generuj mowę.

Na stronie Generuj mowę skopiuj i wklej tekst do przekonwertowania na mowę lub wybierz Importuj tekst z pliku i prześlij plik w formacie DOCX lub TXT.

Po dodaniu tekstu przejdź do panelu Ustawienia mowy po lewej stronie i użyj rozwijanej listy Model, aby wybrać Firefly Speech.

Wskazówka:

Możesz także użyć modelu partnerskiego, takiego jak ElevenLabs Multilingual v2, do generowania mowy z tekstu.

Użyj menu rozwijanego Głos, aby wybrać głos.Pod rozwijanym menu Głos możesz dostosować akcent/język, wysokość i szybkość, aby nadać swojemu głosowi unikalny styl.

Sekcja Ustawienia mowy w lewym panelu wyświetla model Firefly Speech i rozwinięte menu rozwijane Głos z listą wszystkich dostępnych głosów.
Wybierz głos, który najlepiej odpowiada wymaganiom Twojego projektu i jest zgodny z Twoimi celami twórczymi.

Uwaga:

Lista głosów załaduje się tylko wtedy, gdy jesteś zalogowany na swoim konto Firefly.

Użyj menu rozwijanego Wybierz język i wybierz język oraz akcent z listy języków, na przykład angielski (Stany Zjednoczone) i angielski (Indie).

Sekcja Ustawienia mowy wyświetla menu rozwijane Akcent oraz suwaki szybkości i wysokości głosu do dostosowania generowania mowy.
Dostosuj wybrany głos, regulując jego akcent, prędkość i wysokość tonu.

A. Wybierz język B. Prędkość C. Wysokość dźwięku 

Jeśli chcesz zmienić prędkośćwysokość generowanej mowy, dostosuj następujące ustawienia mowy:
  • Prędkość: przesuń suwak prędkości w prawo, aby zwiększyć prędkość odtwarzania, lub w lewo, aby ją zmniejszyć.
  • Wysokość dźwięku: przesuń suwak wysokości dźwięku w prawo, aby zwiększyć wysokość dźwięku, lub w lewo, aby ją zmniejszyć.
Wskazówka:
  • Przejdź do dolnej części lewego panelu i wybierz ikonę , aby odtworzyć próbkę audio wybranego głosu oraz dostosować prędkość, wysokość i akcent.
  • Możesz także dodać głos do ulubionych, wybierając ikonę .

W głównym oknie edytora tekstu możesz wprowadzić dodatkowe zmiany w wprowadzonym tekście:

  • Odtwórz: podgląd wybranego tekstu w przesłanej zawartości przed jej wygenerowaniem.
Strona Generuj mowę wyświetla okno edytora tekstu z podświetlonym przyciskiem Odtwórz umożliwiającym podgląd wyjścia głosowego.
Użyj przycisku odtwarzania, aby szybko odsłuchać, jak tekst brzmi z wybranymi ustawieniami głosu.

  • Popraw wymowę: popraw wymowę i dodaj dodatkowe wskazówki dotyczące brzmienia określonych słów.
  • Znajdź i zamień: wybierz słowa i zamień je.
  • Dodaj ton: dodaj tonację do swojego audio i określ intonację generowanej mowy.
Aby wprowadzić dodatkowy tekst do skryptu, dodać pauzę lub wyświetlić wskazówki dotyczące pisania, przejdź do paska Generuj i wybierz następujące opcje:
  • Dodaj tekst: dodaj dodatkowy tekst do przesłanej zawartości, importując plik TXT lub DOCX.
  • Dodaj pauzę: dodaj pauzy, aby ścieżka dźwiękowa brzmiała bardziej naturalnie.
  • Pokaż wskazówki: wyświetl wskazówki dotyczące pisania, aby uzyskać najlepsze możliwe rezultaty.
Strona Generuj mowę wyświetla okno edytora tekstu z podświetlonym przyciskiem Dodaj tekst na pasku Generuj.
Najedź kursorem na elementy menu, aby zrozumieć ich funkcję.

Wybierz opcję Generuj.

Gdy wygenerowany dźwięk będzie zadowalający, wybierz opcję Pobierz, aby zapisać kopię pliku audio na lokalnym urządzeniu.