Generar voz utilizando modelos de partners

Última actualización el 28 oct 2025

Aprende cómo usar modelos partner para generar clips de audio con diferentes voces, tonos y acentos.

Pruébelo en la aplicación
Genere voz a partir de texto en unos pocos y sencillos pasos.

Con Generate Speech (beta)puede generar clips de audio utilizando modelos de partners para crear rápidamente voces en off con un sonido natural. Puedes establecer diferentes voces y tonalidades ajustando las funcionalidades principales de la generación de voz, como la velocidad y la estabilidad.

En la página principal de Firefly, seleccione Generar en el panel izquierdo y luego Generate speech (beta).

En la página Generate Speech, copie y pegue el texto que desea convertir en voz o seleccione Añadir texto y cargue un archivo en formato DOCX o TXT.

Después de añadir el texto, vaya al panel Ajustes de voz de la izquierda y utilice el menú desplegable Modelo para seleccionar ElevenLabs Multilingual v2.

Nota:

También puede crear clips de audio con el modelo Firefly Speech

Utilice el menú desplegable Voz y seleccione una voz.

La ventana De texto a voz de Firefly muestra el panel de ajustes de voz con el menú desplegable Voz resaltado.
Elige la voz que mejor se adapte a los requisitos de tu proyecto y se alinee con tus objetivos creativos.

Puedes dar carácter a la voz seleccionada cambiando su velocidad, estabilidad, estilo, exageración y otras configuraciones generales.

  • Velocidad: Arrastre la barra de Velocidad hacia la derecha para aumentar o hacia la izquierda para reducir la velocidad del audio generado.
  • Estabilidad: Arrastre la barra de Estabilidad hacia la derecha para aumentar o hacia la izquierda para reducir la estabilidad del audio generado.
  • Similitud: Arrastre la barra de Similitud hacia la derecha para aumentar o hacia la izquierda para reducir la similitud con el audio de voz seleccionado.
  • Exageración de estilo: Arrastre la barra de Exageración de estilo hacia la derecha para aumentar o hacia la izquierda para reducir la adhesión al estilo de audio seleccionado.
  • Mejora del orador: Active la opción Mejora del orador para aumentar la similitud de la voz sintetizada y el texto hablado.
Sugerencia:
  • Navega hasta la parte inferior del panel izquierdo y selecciona el icono para reproducir una muestra de audio de la voz que has seleccionado y ajusta los controles.
  • También puedes añadir la voz a tus favoritos seleccionando el icono .

En la ventana del editor de texto principal, puede realizar modificaciones adicionales al texto introducido:

  • Reproducir: Vista previa del texto seleccionado en el contenido cargado antes de generarlo.
La pantalla De texto a voz muestra la ventana del editor de texto con el botón Reproducir resaltado para obtener una vista previa de la salida de voz.
Utilice el botón Reproducir para ver rápidamente cómo suena el texto con los ajustes de voz seleccionados.

  • Corregir pronunciación: Corrija la pronunciación y agregue orientación adicional sobre cómo deben sonar ciertas palabras.
  • Buscar y reemplazar: Seleccione palabras y sustitúyalas.
  • Añadir texto: Agregue texto adicional al contenido cargado importando un archivo TXT o DOCX.
  • Agregar pausa: Agregue pausas para que la pista de audio suene más natural.
  • Agregar tono: Agregue tonalidad a su audio y defina la entonación del discurso generado.

Seleccione Generar.

Una vez que esté satisfecho con la generación y cómo suena, seleccione Descargar para guardar una copia del archivo de audio en formato WAV o MP3.