lunes, 28 de octubre de 2024

XTTS: texto a voz en la web a partir de un audio, usando la IA!

Hola gente, ¿qué tal les va?

Muy atentos. Hoy Libardo Nova nos trae el primero de una serie de tutoriales relacionados con modelos de voz, inferencias, clonaciones y conversión de texto a voz utilizando la inteligencia artificial.

Nota Aclaratoria:

En este tutorial se proporciona información general sobre XTTS con fines didácticos. De manera personal, cada usuario es responsable de lo que haga con esta herramienta. Por lo tanto, Tecnoconocimiento Accesible no se hace responsable por cualquier mal uso o consecuencia derivada de la misma.

Qué es XTTS?

XTTS es una herramienta poderosa que permite crear voces sintéticas de alta calidad. Sus usos son diversos y prometen transformar la forma en que experimentamos con la inteligencia artificial, Puesto que va mucho más allá de utilizar la tecnología Text-to-Speech (texto a voz), acercándola cada vez más a la calidad de la voz humana.

¿Qué hace especial a XTTS?

• Clonación de Voz de Alta Fidelidad: Con solo unos pocos segundos de audio de una voz en particular, XTTS puede crear un modelo capaz de generar voz sintética prácticamente idéntica a la original. Esto permite aplicaciones como la creación de asistentes virtuales con voces personalizadas o la producción de audiolibros con la voz del autor o autores de doblaje.

• Multilingüismo: XTTS no se limita a un solo idioma. Puede ser entrenado en múltiples lenguas, permitiendo la generación de voz en una amplia variedad de idiomas y acentos.

• Expresividad: Los modelos XTTS pueden capturar la entonación, el ritmo y el énfasis de la voz original, lo que resulta en una síntesis de voz mucho más natural y expresiva.

¿Qué necesitamos para utilizar XTTS?

• Un navegador web.

 • Conexión a internet.

• Un texto no superior a 200 caracteres.

• Un archivo de voz previamente preparado.

TutorialXTTS; Convertir texto a voz en la web a partir de un audio, usando la IA (Tutorial 1).

En este tutorial Libardo nos mostrará:

• Explicación detallada del proceso de conversión de texto a voz.

 •Recomendaciones gramaticales para el texto que vamos a usar en la conversión (prompt).

 • Cómo insertar nuestro propio prompt.

• Cómo indicarle el idioma español a XTTS.

• Cómo quitar el audio de voz que XTTS nos da por defecto y cargar el nuestro.

• Cómo escuchar previamente el resultado de la conversión.

• Cómo descargar la voz creada (formato MP3 o MP4).

La descarga.

Les dejaré en la descarga:

• El audio tutorial (en los canales Odysse y YouTube estará en video tutorial).

• Link directo a la web de XTTS.

Y ya sabes, Si te gusta este contenido,

compártelo en: Facebook; X.

Deja un comentario sobre esta entrada.

Síguenos en X:

Abajo tienes el botón.

Suscríbete al blog:

Ahora puedes unirte a nuestros grupos de WhatsApp o Telegram:

Puedes escribir al mail del blog con tus datos si deseas ingresar a los mismos.

Escucha todos nuestros audios tutoriales, cómodamente:

Entrando desde aquí, a nuestro canal en YouTube.

Ahora también, en nuestro canal en Odysse:

Entra al canal de Tecnoconocimiento Accesible en Odysse.

O si prefieres escúchanos en:

Anchor:

Escúchanos en Anchor.

Ponte en contacto con nosotros, déjanos tus sugerencias, dudas, o comentarios,

abajo tienes un sencillo formulario,

o si lo prefieres,

 escríbenos al correo del blog:

tecnoconocimientoaccesible@gmail.com

Los aportes siempre serán bienvenidos.

cuando nos escribas por uno de los medios con alguna sugerencia, se publicará con tu nombre.

además, como ya se sabe, puedes publicar esta entrada en otro sitio, pero no te olvides citar la fuente.

Saludos, y hasta otro post.

Descarga aquí el tutorial.

Entra aquí en la web de XTTS.

 


2 comentarios:

  1. hola amigos.
    Con respecto al tutorial el lunes pasado.
    la pregunta es: como volver al resultado anterior luego que doy a send y como escuchar l la inferencia y el original.

    Un abrazo y gracias por todo

    ResponderEliminar
  2. La inferencia original es el botón de reproducir justo antes de send. Vas con la shift b hasta reproducir.

    ResponderEliminar