Hola gente, ¿qué tal les va?
Hoy muy atentos: ¡Native Speech Generation para NVDA!
Pero ¿Qué es Native Speech Generation?
Native Speech Generation es un complemento (add-on) para el lector de pantalla NVDA que permite convertir texto en voz natural de alta calidad aprovechando la inteligencia artificial de Google Gemini.
Este complemento integra directamente los servicios de text-to-speech (TTS) de Google Gemini dentro de NVDA, ofreciendo una forma accesible, moderna y flexible de generar audio — ideal para personas con discapacidad visual, creadores de contenido o desarrolladores que quieren narración asistida por IA.
Principales características
Voz natural con IA de Google
El complemento usa los modelos de Google Gemini, que generan audio muy realista a partir de texto. Puedes elegir entre distintos modos de voz, desde narración estándar hasta voces más expresivas o realistas según el modelo que selecciones.
Modo de un solo hablante y múltiples voces
Puedes generar audio con:
•
Una sola voz: perfecto para lectura de textos largos o narraciones continuas.
•
Modo de varios hablantes: lo que permite crear diálogos donde cada personaje tiene su propia voz distinta.
Control avanzado de estilo y expresividad
El complemento no solo lee texto, sino que te permite dar “instrucciones de estilo” — por ejemplo, indicarle que hable con tono alegre, serio o pausado — y también controlar parámetros como la “temperatura”, lo que afecta el carácter de la voz generada.
A continuación les dejo el tutorial: Como conseguir una clave API gratuita de Gemini:
https://www.youtube.com/watch?v=2uNJGHQENSE&t=31s
Requisitos para utilizar: Native Speech Generation:
Se necesitan:
•
NVDA (Probado en la versión: 2025.3).
•
Una clave API de Google Gemini AI (que obtienes desde Google AI Studio).
•
Conexión a Internet, ya que la voz se genera en la nube.
Tutorial: 🎙️ Voces de GeminiTTS en NVDA, con: Native Speech Generation!
En este tutorial les mostraré:
• Instalación del complemento Native Speech Generation.
• Descarga de dependencias de: Native Speech Generation.
• Como colocar la clave API de Gemini, en Native Speech Generation.
• Como convertir de texto a voz con Native Speech Generation, con un solo hablante (single speaker), configurar estilo del habla, temperatura, selección de modelo y seleccionar una voz).
• Como empezar a generar de texto a voz con Native Speech Generation.
• Muestra del resultado de la generación de texto a voz.
• Como guardar el audio generado.
• Como crear un diálogo entre dos personas con Native Speech Generation (multi speaker), (estilo, temperatura, cambiar nombre a personas, elección de las voces).
• Como generar el audio de texto a voz del diálogo, y como guardarlo.
• Como utilizar la función: hablar con IA (una especie de asistente), de Native Speech Generation.
La descarga.
Les dejaré en la descarga:
• El audio tutorial (en los canales Odysse y YouTube estará en video tutorial).
• Descarga del complemento Native Speech Generation.
• Enlace al repositorio de Native Speech Generation.
Espero lo disfruten y les sea de mucha utilidad.
Este es una forma de utilizar las excelentes voces de Google Gemini TTS, cómodamente desde nuestro lector NVDA.
Y ya sabes, Si te gusta este contenido,
Apóyanos haciendo una donación:
compártelo en: Facebook, X.
Deja un comentario sobre esta entrada.
Síguenos en X:
Abajo tienes el botón.
Ahora puedes seguirnos también en Facebook:
Entra aquí a nuestro Facebook.
Suscríbete al blog:
Ahora puedes unirte a nuestros grupos de WhatsApp o Telegram:
Puedes escribir al mail del blog con tus datos si deseas ingresar a los mismos.
Escucha todos nuestros audio tutoriales, cómodamente:
Entrando desde aquí, a nuestro canal en YouTube.
Ahora también, en nuestro canal en Odysse:
Entra al canal de Tecnoconocimiento Accesible en Odysse.
O si prefieres escúchanos en:
Anchor:
Ponte en contacto con nosotros, déjanos tus sugerencias, dudas, o comentarios,
abajo tienes un sencillo formulario,
o si lo prefieres,
escríbenos al correo del blog:
tecnoconocimientoaccesible@gmail.com
Los aportes siempre serán bienvenidos.
cuando nos escribas por uno de los medios con alguna sugerencia, se publicará con tu nombre.
además, como ya se sabe, puedes publicar esta entrada en otro sitio, pero no te olvides citar la fuente.
Saludos, y hasta otro post.
Entra aquí al repositorio de Native Speech Generation.