Generar voz a partir de texto

Última actualización el 28/10/2025

Aprende a usar indicaciones de texto para generar clips de audio con diferentes voces, tonos y acentos usando Firefly.

Pruébelo en la aplicación
Genere voz a partir de texto en unos pocos y sencillos pasos.

Generar voz (beta) te permite generar clips de audio y voces en off con un sonido natural.Puedes usar controles como acento, idioma, velocidad y tono para personalizar las características de voz que mejor se adapten a tus necesidades.

En la página principal de Firefly, selecciona Generar desde el panel izquierdo y luego selecciona Generar voz.

En la página de Generar voz, copia y pega el texto para convertirlo en voz o selecciona Agregar texto y sube un archivo en formato DOCX o TXT.

Después de agregar el texto, navega al panel de Configuración de voz a la izquierda y usa el menú desplegable Modelo para seleccionar Firefly Speech.

Sugerencia:

También puedes usar un modelo partner, como ElevenLabs Multilingual v2, para generar voz a partir de texto.

Usa el menú desplegable Voz y selecciona una voz.

Usa este panel para ajustar el acento, el tono y la velocidad para dar a tu voz un estilo único.

La sección de Configuración de voz en el panel izquierdo muestra el modelo Firefly Speech y un menú desplegable de Voz expandido que enumera todas las voces disponibles.
Selecciona la voz que mejor se adapte a los requisitos de tu proyecto y se alinee con tus objetivos creativos.

Nota:

La lista de voces solo se cargará si has iniciado sesión en tu cuenta de Firefly.

Usa el menú desplegable Seleccionar un idioma y elige un idioma y el acento de entrega de la lista de idiomas, como Inglés (EE. UU.), Inglés (Reino Unido) y Inglés (India).

La sección de Configuración de voz muestra el menú desplegable de Acento y los controles deslizantes de velocidad y tono para ajustar la generación de voz.
Personaliza la voz seleccionada ajustando su acento, velocidad y tono.

A. Selecciona un idioma B. Velocidad C. Tono 

Si deseas cambiar la Velocidad y el Tono de la voz generada, ajusta las siguientes configuraciones de voz:
  • Velocidad: Arrastra la barra de velocidad hacia la derecha para aumentar o hacia la izquierda para disminuir la velocidad del audio hablado.
  • Tono: Arrastra la barra de tono hacia la derecha para aumentar o hacia la izquierda para disminuir el tono del audio hablado.
Sugerencia:
  • Navega hasta la parte inferior del panel izquierdo y selecciona el icono para reproducir una muestra de audio de la voz que has seleccionado y ajustado la velocidad, el tono y el acento.
  • También puedes agregar la voz a tus favoritos seleccionando el icono.

En la ventana principal del editor de texto, puedes realizar ediciones adicionales al texto ingresado:

  • Reproducir: Vista previa del texto seleccionado en tu contenido cargado antes de generarlo.
La página Generar voz muestra la ventana del editor con el botón Reproducir resaltado para obtener una vista previa de la salida de voz.
Utiliza el botón Reproducir para obtener rápidamente una vista previa de cómo suena el texto con la Configuración de voz seleccionada.

  • Corregir pronunciación: Corrige la pronunciación y añade indicaciones adicionales sobre cómo deben sonar ciertas palabras.
  • Buscar y reemplazar: Seleccionar palabras y reemplazarlas.
  • Añadir texto: Añade texto adicional al contenido cargado importando un archivo TXT o DOCX.
  • Añadir pausa: Añade pausas para que la pista de audio suene más natural.
  • Añadir tono: Añade tonalidad a tu audio y define la entonación del habla generada.

Seleccione Generar.

Cuando estés satisfecho con la generación y cómo suena, selecciona Descargar para guardar una copia del archivo de audio en formato WAV o MP3.