lunes, 9 de febrero de 2026

Voces de GeminiTTS en NVDA, con: Native Speech Generation!

Hola gente, ¿qué tal les va?

Hoy muy atentos: ¡Native Speech Generation para NVDA!

Pero ¿Qué es Native Speech Generation?

Native Speech Generation es un complemento (add-on) para el lector de pantalla NVDA que permite convertir texto en voz natural de alta calidad aprovechando la inteligencia artificial de Google Gemini.

Este complemento integra directamente los servicios de text-to-speech (TTS) de Google Gemini dentro de NVDA, ofreciendo una forma accesible, moderna y flexible de generar audio — ideal para personas con discapacidad visual, creadores de contenido o desarrolladores que quieren narración asistida por IA.

Principales características

Voz natural con IA de Google

El complemento usa los modelos de Google Gemini, que generan audio muy realista a partir de texto. Puedes elegir entre distintos modos de voz, desde narración estándar hasta voces más expresivas o realistas según el modelo que selecciones.

Modo de un solo hablante y múltiples voces

Puedes generar audio con:

Una sola voz: perfecto para lectura de textos largos o narraciones continuas.

Modo de varios hablantes: lo que permite crear diálogos donde cada personaje tiene su propia voz distinta.

Control avanzado de estilo y expresividad

El complemento no solo lee texto, sino que te permite dar “instrucciones de estilo” — por ejemplo, indicarle que hable con tono alegre, serio o pausado — y también controlar parámetros como la “temperatura”, lo que afecta el carácter de la voz generada.

 

A continuación les dejo el tutorial: Como conseguir una clave API gratuita  de Gemini:

https://www.youtube.com/watch?v=2uNJGHQENSE&t=31s

 

Requisitos para utilizar: Native Speech Generation:

 

Se necesitan:

NVDA (Probado en la versión: 2025.3).

Una clave API de Google Gemini AI (que obtienes desde Google AI Studio).

Conexión a Internet, ya que la voz se genera en la nube.

 

Tutorial: 🎙️ Voces de GeminiTTS en NVDA, con: Native Speech Generation!

En este tutorial les mostraré:

• Instalación del complemento Native Speech Generation.

• Descarga de dependencias de: Native Speech Generation.

• Como colocar la clave API de Gemini, en Native Speech Generation.

• Como convertir de texto a voz con Native Speech Generation, con un solo hablante (single speaker), configurar estilo del habla, temperatura, selección de modelo y seleccionar una voz).

• Como empezar a generar de texto a voz con Native Speech Generation.

• Muestra del resultado de la generación de texto a voz.

• Como guardar el audio generado.

• Como crear un diálogo entre dos personas con Native Speech Generation (multi speaker), (estilo, temperatura, cambiar nombre a personas, elección de las voces).

• Como generar el audio de texto a voz del diálogo, y como guardarlo.

• Como utilizar la función: hablar con IA (una especie de asistente), de Native Speech Generation.

 

La descarga.

Les dejaré en la descarga:

• El audio tutorial (en los canales Odysse y YouTube estará en video tutorial).

• Descarga del complemento Native Speech Generation.

• Enlace al repositorio de Native Speech Generation.

 

Espero lo disfruten y les sea de mucha utilidad.

Este es una forma de utilizar las excelentes voces de Google Gemini TTS, cómodamente desde nuestro lector NVDA.

 

Y ya sabes, Si te gusta este contenido,

Apóyanos haciendo una donación:

Dona aquí en PayPal.

compártelo en: Facebook, X.

Deja un comentario sobre esta entrada.

Síguenos en X:

Abajo tienes el botón.

Ahora puedes seguirnos también en Facebook:

Entra aquí a nuestro Facebook.

Suscríbete al blog:

Ahora puedes unirte a nuestros grupos de WhatsApp o Telegram:

Puedes escribir al mail del blog con tus datos si deseas ingresar a los mismos.

Escucha todos nuestros audio tutoriales, cómodamente:

Entrando desde aquí, a nuestro canal en YouTube.

Ahora también, en nuestro canal en Odysse:

Entra al canal de Tecnoconocimiento Accesible en Odysse.

O si prefieres escúchanos en:

Anchor:

Escúchanos en Anchor.

Ponte en contacto con nosotros, déjanos tus sugerencias, dudas, o comentarios,

abajo tienes un sencillo formulario,

o si lo prefieres,

 escríbenos al correo del blog:

tecnoconocimientoaccesible@gmail.com

Los aportes siempre serán bienvenidos.

cuando nos escribas por uno de los medios con alguna sugerencia, se publicará con tu nombre.

además, como ya se sabe, puedes publicar esta entrada en otro sitio, pero no te olvides citar la fuente.

Saludos, y hasta otro post.

 

Descarga aquí el tutorial.

 

Descarga aquí el complemento.

 

Entra aquí al repositorio de Native Speech Generation.


lunes, 2 de febrero de 2026

Crear audiolibros con voces Neurales y +, con Sonarpad!

Hola gente, ¿qué tal les va?

Muy atentos, tremendo programas: Sonarpad, libros, audio libros con voces neurales y mucho más!

Apenas antes de preparar esta entrada, el autor le cambió de nombre, antes se llamaba Novapad, incluso en el tutorial utilizo una versión con este nombre, pero es lo mismo.

¿Qué es Sonarpad?

Desarrollada por: Ambrogio Riili, Es una aplicación de código abierto para Windows escrita en Rust (lo que garantiza rapidez y seguridad de memoria). Se posiciona como una alternativa vitaminada al Bloc de notas, integrando herramientas que normalmente requerirían varios programas distintos.

Características Principales

Accesibilidad de Vanguardia:

Es 100% accesible.

Text-to-Speech (TTS): Permite leer cualquier documento en voz alta.

Voces de Alta Calidad: Soporta las voces Microsoft Edge Neural (que suenan muy naturales) y las clásicas SAPI5 de Windows.

Interfaz Adaptable: Diseñada para ser fácil de usar con lectores de pantalla y configuraciones de alto contraste.

Creación de Contenido y Audiolibros:

Exportación a MP3: Puedes convertir tus notas o libros digitales directamente en archivos de audio para escucharlos en cualquier lugar.

Grabadora de Podcasts: Incluye una función para grabar audio directamente desde el micrófono o capturar el sonido del sistema, facilitando la creación de contenido tipo podcast.

Gestión de Documentos:

Multiformato: Lee y edita archivos .txt, .rtf, .md (Markdown) y otros formatos comunes.

Sistema de Marcadores Inteligente: A diferencia de un editor común, puedes poner "marcapáginas" tanto en el texto como en puntos específicos de un archivo de audio.

Reproductor MP3 Integrado: Ideal para revisar audiolibros o grabaciones sin salir de la aplicación.

 

Compatibilidad de Sonarpad.

Este programa es compatible con:

• Windows 10 64 bits.

• Windows 11.

 

Tutorial: 📘 Crear audiolibros con voces Neurales y +, con Sonarpad!

Este programa tiene muchas funcionalidades útiles e interesantes, entonces lo he dividido en varias partes, en este primer tutorial me enfocaré en la gestión de libros, creación de audio libros.

Les mostraré:

• Como cargar un libro en Sonarpad.

• Como leer un libro con nuestro lector de pantalla en Sonarpad.

• Como poner un marcador en un libro.

• Como abrir los archivos recientes en Sonarpad.

• Como recuperar un marcador antes establecido (desde la gestión de marcadores).

• Como leer con una voz TTS (reproducir, pausar, y detener).

• Como seleccionar desde las opciones de Sonarpad, otra voz TTS.

• Como aumentar, disminuir velocidad, y probar las voces TTS Neurales.

• Como hacer que se mueva el cursor durante la lectura (desde las opciones).

• Como crear un audiolibro con Sonarpad.

• Breve muestra del audiolibro creado en partes.

• Como reproducir un audio con Sonarpad.

• Como pausar, reproducir, bajar/subir volumen, adelantar/retroceder un audio en Sonarpad.

• Como crear audiolibros por lotes con Sonarpad.

 

La descarga.

Les dejaré en la descarga:

• El audio tutorial (en los canales Odysse y YouTube estará en video tutorial).

• El programa Sonarpad en versión portable.

• Enlace a el repositorio oficial de Sonarpad.

 

Espero lo disfruten y les sea de mucha utilidad.

Este es un programa muy útil y completo, tiene sinnúmero de funcionalidades muy interesantes.

 

Y ya sabes, Si te gusta este contenido,

Apóyanos haciendo una donación:

Dona aquí en PayPal.

compártelo en: Facebook, X.

Deja un comentario sobre esta entrada.

Síguenos en X:

Abajo tienes el botón.

Ahora puedes seguirnos también en Facebook:

Entra aquí a nuestro Facebook.

Suscríbete al blog:

Ahora puedes unirte a nuestros grupos de WhatsApp o Telegram:

Puedes escribir al mail del blog con tus datos si deseas ingresar a los mismos.

Escucha todos nuestros audio tutoriales, cómodamente:

Entrando desde aquí, a nuestro canal en YouTube.

Ahora también, en nuestro canal en Odysse:

Entra al canal de Tecnoconocimiento Accesible en Odysse.

O si prefieres escúchanos en:

Anchor:

Escúchanos en Anchor.

Ponte en contacto con nosotros, déjanos tus sugerencias, dudas, o comentarios,

abajo tienes un sencillo formulario,

o si lo prefieres,

 escríbenos al correo del blog:

tecnoconocimientoaccesible@gmail.com

Los aportes siempre serán bienvenidos.

cuando nos escribas por uno de los medios con alguna sugerencia, se publicará con tu nombre.

además, como ya se sabe, puedes publicar esta entrada en otro sitio, pero no te olvides citar la fuente.

Saludos, y hasta otro post.

 

Descarga aquí el tutorial.

 

Descarga aquí el programa portable.

 

Entra aquí al repositorio de Sonarpad.


lunes, 26 de enero de 2026

Como conseguir una clave API de Gemini en 2026!

Hola gente, ¿qué tal les va?

Hoy muy atentos. ¡Aprenderemos en 2026 como conseguir una clave API en Google AI Studio, para poder utilizar Gemini en muchas cosas!

Como se que se ha vuelto un tanto complejo el proceso para poder conseguir una API en Google AI Studio, entonces;

para usar los modelos Gemini en tus programas o en herramientas como RayoAI, Basilisk LM u otras aplicaciones de IA que consumen modelos remotos.

En esta entrada les enseño paso a paso cómo conseguir una clave de API desde Google AI Studio, algo imprescindible si quieres usar los modelos de la familia Gemini desde tus propios programas o en aplicaciones que ya hemos visto en Tecnoconocimiento Accesible.

Pero ¿Qué es una clave de API y para qué sirve?

Una clave de API (API Key) es un identificador único que te permite conectar tus aplicaciones con los servicios de Google, en este caso para usar los modelos de IA como Gemini.

¿Para qué sirve?

Una clave de API te permite conectar tus códigos o aplicaciones con los servicios de inteligencia artificial de Google, incluyendo los modelos de texto multimodal, y usar funciones avanzadas de generación de contenido, análisis o descripción.

Por ejemplo:

 Usar programas como RayoAI, complementos de NVDA, etc.  para descripciones de imágenes u otras funciones que requieren una clave de Gemini.

✔️ Integrar modelos de Gemini en proyectos y scripts que antes probaste con Basilisk LM o en otros entornos.

✔️ Conectar tus propios programas Python, JavaScript o herramientas como LangChain con la API de Google.

Y muchas cosas más.

 

¿Qué necesitamos para conseguir una clave API en Google AI Studio?

Necesitamos:

• Contar con una cuenta de correo electrónico de Gmail.

• Conexión a internet.

• Cualquier navegador de internet.

 

Tutorial: 💻 Como conseguir una clave API de Gemini en 2026!

En este tutorial les mostraré:

• Ingresar a la web de Google AI Studio en el apartado de conseguir una API Key.

• Como empezar el paso a paso para conseguir la API key.

• Como establecer un nombre a la clave API.

• Muestra de por qué no se activa el botón: “Conseguir API Key”.

• Muestra de como seleccionar correctamente el crear nuevo proyecto.

• Como asignarle un nombre al nuevo proyecto y crearlo.

• Como obtener la clave API.

• Como copiar nuestra clave API al portapapeles.

 

La descarga.

Les dejaré en la descarga:

• El audio tutorial (en los canales Odysse y YouTube estará en video tutorial).

• Enlace para ir a la web de Google AI Studio en el apartado Conseguir API Key.

 

Espero les sea de mucha utilidad.

atentos, les recomiendo encarecidamente que vayan consiguiendo no solo una clave, sino todas las que puedan, que se vienen cosas donde la vamos a necesitar.

 

Y ya sabes, Si te gusta este contenido,

Apóyanos haciendo una donación:

Dona aquí en PayPal.

compártelo en: Facebook, X.

Deja un comentario sobre esta entrada.

Síguenos en X:

Abajo tienes el botón.

Ahora puedes seguirnos también en Facebook:

Entra aquí a nuestro Facebook.

Suscríbete al blog:

Ahora puedes unirte a nuestros grupos de WhatsApp o Telegram:

Puedes escribir al mail del blog con tus datos si deseas ingresar a los mismos.

Escucha todos nuestros audio tutoriales, cómodamente:

Entrando desde aquí, a nuestro canal en YouTube.

Ahora también, en nuestro canal en Odysse:

Entra al canal de Tecnoconocimiento Accesible en Odysse.

O si prefieres escúchanos en:

Anchor:

Escúchanos en Anchor.

Ponte en contacto con nosotros, déjanos tus sugerencias, dudas, o comentarios,

abajo tienes un sencillo formulario,

o si lo prefieres,

 escríbenos al correo del blog:

tecnoconocimientoaccesible@gmail.com

Los aportes siempre serán bienvenidos.

cuando nos escribas por uno de los medios con alguna sugerencia, se publicará con tu nombre.

además, como ya se sabe, puedes publicar esta entrada en otro sitio, pero no te olvides citar la fuente.

Saludos, y hasta otro post.

 

Descarga aquí el tutorial.

 

consigue aquí la clave API Google AI Studio.