
La integración de inteligencia artificial en los servicios de Google continúa avanzando con pasos firmes, y ahora Google Docs incorpora una función largamente esperada: la lectura en voz alta a través de Gemini. A partir de este mes, el popular procesador de textos permite a los usuarios transformar cualquier documento en inglés en un archivo de audio de manera sencilla y con un grado de personalización avanzada, marcando un nuevo paradigma en la accesibilidad y la experiencia de edición en la nube.
Con la llegada de esta funcionalidad, Google Docs da un salto significativo en la interacción entre usuario y documento. Ahora, gracias a Gemini, es posible escuchar el contenido textual reproducido mediante voces artificiales de notable naturalidad. Se pueden escoger diferentes estilos y velocidades, adecuando la narración según las necesidades o el propósito del texto. Entre las opciones de entonación que Google ha puesto a disposición destacan perfiles como Narrador, Educador, Profesor, Persuasor, Explicador, Coach y Motivador, cada uno orientado a adaptarse al tono y la intención del documento original.
PUBLICIDAD
Por ahora, esta innovación está limitada a documentos en inglés y en la versión de escritorio web, con un despliegue progresivo que arrancó esta semana y que se extenderá durante las siguientes. La compañía no ha especificado cuándo ni si planea habilitar la función en otros idiomas o plataformas móviles. El acceso a la herramienta está reservado a usuarios que cuenten con planes Workspace comerciales, empresariales o educativos, así como a suscriptores de los servicios AI Pro y Ultra, y quienes dispongan del complemento Gemini Education Premium.

Cómo usar la voz de Gemini en Google Docs
El proceso para activar la lectura en voz alta es intuitivo y no requiere conocimientos técnicos avanzados. Dentro de la versión web de Google Docs, basta con dirigirse al menú de herramientas, donde la opción de audio se encuentra situada entre la entrada por voz y el acceso directo a Gemini. Al seleccionarla, aparecerá en la pantalla un reproductor con formato de pastilla que muestra la duración total del audio generado. El usuario puede controlar la reproducción, pausar o adelantar, además de escoger la voz y la velocidad que se ajusten mejor a sus preferencias.
PUBLICIDAD
Un detalle relevante es que el sistema de voces de Gemini no se limita a ofrecer un simple lector automático, sino que proporciona una experiencia variada y personalizable. Esta posibilidad hace que la narración no solo resulte útil para la accesibilidad, sino también para dar un enfoque más profesional o emocional a los contenidos, dependiendo de si se prefiere un tono pedagógico, motivacional o simplemente informativo.
Otra característica destacada es la capacidad de insertar botones de audio en puntos específicos del documento, lo que facilita que cualquier persona con acceso pueda escuchar el fragmento correspondiente sin necesidad de recorrer el texto completo. Esta opción se gestiona desde el menú de “Insertar”, eligiendo la función de botones de audio y después “Listen to tab”, aunque de momento está disponible únicamente en inglés.
PUBLICIDAD

Expertos y plataformas especializadas como 9to5Google han valorado muy positivamente la nueva función, subrayando la utilidad que representa para revisar y detectar errores en un texto, o simplemente para consumir información de un modo más eficiente en situaciones donde no es posible leer directamente. El despliegue paulatino responde al objetivo de afinar la experiencia y recoger sugerencias de usuarios reales antes de considerar futuras ampliaciones.
La apuesta por la integración de inteligencia artificial generativa no se detiene aquí. Paralelamente, Google Docs en Android ha introducido la capacidad de generar imágenes dentro de los documentos, ampliando así las opciones para añadir contenido visual atractivo. Estas novedades siguen la tendencia de otros productos de la compañía, como NotebookLM, aplicación basada en IA que ha revolucionado la creación de podcasts a partir de PDFs y otros archivos.
PUBLICIDAD
En definitiva, la opción de lectura en voz alta mediante Gemini refuerza la posición de Google Docs como una plataforma de edición avanzada, donde la inteligencia artificial no solo ayuda a crear y organizar texto, sino también a mejorar la accesibilidad, la revisión y la creatividad de los usuarios. El futuro cercano apunta a una convivencia más fluida entre palabras, voz e imagen dentro del entorno laboral y educativo.
PUBLICIDAD
PUBLICIDAD
Últimas Noticias
Las contraseñas tradicionales tienen los días contados: así funcionan las passkeys que prometen más seguridad
Esta tecnología permite iniciar sesión sin recordar claves complejas, utilizando huella digital, reconocimiento facial o el teléfono móvil

Como si fueran humanos: los carros autónomos empezarán a recibir multas
Algunos motivos para recibir la infracción son saltar un semáforo en rojo, exceder la velocidad permitida o no respetar una señal de alto

El Modo Xbox ya está disponible en Windows 11 y promete transformar la experiencia gaming en PC
La nueva función forma parte de la estrategia de Microsoft para unificar la experiencia gaming entre Xbox y PC

Hogwarts Legacy gratis en Epic Games Store: hasta esta fecha puedes conseguir el juego de Harry Potter
Este juego es un RPG de acción y mundo abierto que ofrece a los jugadores la posibilidad de recorrer escenarios basados en las obras de J.K. Rowling

El juego de supervivencia que domina las listas de deseos en Steam ya anunció su fecha de lanzamiento oficial
La secuela incorporará multijugador cooperativo, nuevos biomas y criaturas inéditas para expandir la experiencia original



