
La integración de inteligencia artificial en los servicios de Google continúa avanzando con pasos firmes, y ahora Google Docs incorpora una función largamente esperada: la lectura en voz alta a través de Gemini. A partir de este mes, el popular procesador de textos permite a los usuarios transformar cualquier documento en inglés en un archivo de audio de manera sencilla y con un grado de personalización avanzada, marcando un nuevo paradigma en la accesibilidad y la experiencia de edición en la nube.
Con la llegada de esta funcionalidad, Google Docs da un salto significativo en la interacción entre usuario y documento. Ahora, gracias a Gemini, es posible escuchar el contenido textual reproducido mediante voces artificiales de notable naturalidad. Se pueden escoger diferentes estilos y velocidades, adecuando la narración según las necesidades o el propósito del texto. Entre las opciones de entonación que Google ha puesto a disposición destacan perfiles como Narrador, Educador, Profesor, Persuasor, Explicador, Coach y Motivador, cada uno orientado a adaptarse al tono y la intención del documento original.
Por ahora, esta innovación está limitada a documentos en inglés y en la versión de escritorio web, con un despliegue progresivo que arrancó esta semana y que se extenderá durante las siguientes. La compañía no ha especificado cuándo ni si planea habilitar la función en otros idiomas o plataformas móviles. El acceso a la herramienta está reservado a usuarios que cuenten con planes Workspace comerciales, empresariales o educativos, así como a suscriptores de los servicios AI Pro y Ultra, y quienes dispongan del complemento Gemini Education Premium.

Cómo usar la voz de Gemini en Google Docs
El proceso para activar la lectura en voz alta es intuitivo y no requiere conocimientos técnicos avanzados. Dentro de la versión web de Google Docs, basta con dirigirse al menú de herramientas, donde la opción de audio se encuentra situada entre la entrada por voz y el acceso directo a Gemini. Al seleccionarla, aparecerá en la pantalla un reproductor con formato de pastilla que muestra la duración total del audio generado. El usuario puede controlar la reproducción, pausar o adelantar, además de escoger la voz y la velocidad que se ajusten mejor a sus preferencias.
Un detalle relevante es que el sistema de voces de Gemini no se limita a ofrecer un simple lector automático, sino que proporciona una experiencia variada y personalizable. Esta posibilidad hace que la narración no solo resulte útil para la accesibilidad, sino también para dar un enfoque más profesional o emocional a los contenidos, dependiendo de si se prefiere un tono pedagógico, motivacional o simplemente informativo.
Otra característica destacada es la capacidad de insertar botones de audio en puntos específicos del documento, lo que facilita que cualquier persona con acceso pueda escuchar el fragmento correspondiente sin necesidad de recorrer el texto completo. Esta opción se gestiona desde el menú de “Insertar”, eligiendo la función de botones de audio y después “Listen to tab”, aunque de momento está disponible únicamente en inglés.

Expertos y plataformas especializadas como 9to5Google han valorado muy positivamente la nueva función, subrayando la utilidad que representa para revisar y detectar errores en un texto, o simplemente para consumir información de un modo más eficiente en situaciones donde no es posible leer directamente. El despliegue paulatino responde al objetivo de afinar la experiencia y recoger sugerencias de usuarios reales antes de considerar futuras ampliaciones.
La apuesta por la integración de inteligencia artificial generativa no se detiene aquí. Paralelamente, Google Docs en Android ha introducido la capacidad de generar imágenes dentro de los documentos, ampliando así las opciones para añadir contenido visual atractivo. Estas novedades siguen la tendencia de otros productos de la compañía, como NotebookLM, aplicación basada en IA que ha revolucionado la creación de podcasts a partir de PDFs y otros archivos.
En definitiva, la opción de lectura en voz alta mediante Gemini refuerza la posición de Google Docs como una plataforma de edición avanzada, donde la inteligencia artificial no solo ayuda a crear y organizar texto, sino también a mejorar la accesibilidad, la revisión y la creatividad de los usuarios. El futuro cercano apunta a una convivencia más fluida entre palabras, voz e imagen dentro del entorno laboral y educativo.
Últimas Noticias
WhatsApp cambia completamente la regla de juego con tu foto: conoce la nueva función
Cualquier usuario podrá añadir una imagen de portada directamente desde los ajustes de su perfil
Microsoft lanza actualización de urgencia para Windows 11: resuelve varias fallas
Los parches de seguridad pueden descargarse directamente desde el Catálogo de Microsoft Update

Cómo funciona la Inteligencia Personal de Google Gemini para extraer información clave de correos y fotos
Gracias a esta función, ahora es posible conectar aplicaciones como Gmail, Google Fotos, YouTube y Búsqueda con solo un toque

xAI, la empresa de Elon Musk, restringió la edición de imágenes en Grok luego de la generación de deepfakes sexualizados
Según la compañía, la limitación alcanza a todos los usuarios, incluso a quienes tienen una suscripción de pago
Libera espacio en tu iPhone con estos siete métodos prácticos
El sistema operativo de Apple ofrece una función que permite guardar las imágenes en iCloud en una calidad reducida, liberando espacio en el dispositivo



