
Ya no es necesario escribir guiones ni grabar voces para producir un podcast. Google amplió las capacidades de su herramienta de inteligencia artificial (IA) que genera resúmenes de audio, permitiendo ahora su uso en más de 50 idiomas, incluidos español, portugués, francés, turco, coreano y chino.
La función, disponible a través de la plataforma Gemini y la aplicación NotebookLM, convierte documentos, presentaciones y archivos en conversaciones de audio simuladas entre dos presentadores de IA.
Hasta hace poco, esta tecnología solo operaba en inglés, pero ahora es posible configurar el idioma de salida desde la sección de ajustes en NotebookLM, tanto en su versión web como en dispositivos móviles.

Para cambiar de idioma, los usuarios deben dirigirse a NotebookLM, seleccionar la configuración ubicada en la esquina superior derecha de la pantalla y elegir “Idioma de salida”.
Desde allí, se puede seleccionar el idioma preferido para recibir respuestas, escuchar los resúmenes en formato de audio y ajustar otros parámetros de salida de la conversación generada.
Cómo funcionan los ‘Resúmenes de audio’ de Google
Los ‘Resúmenes de audio’ transforman documentos, diapositivas e incluso informes de investigación extensos en discusiones estilo podcast.

La tecnología genera de forma automática las voces y los guiones a través de sistemas conversacionales que permiten simular una discusión profunda basada en el contenido proporcionado. La locución y el diseño del diálogo no requieren intervención humana en ningún momento del proceso.
Desde su lanzamiento inicial en 2023, Audio Overviews —nombre que recibe esta función en inglés— ha sido incorporado en diversas plataformas de Google. Además de NotebookLM, la herramienta está disponible en el chatbot Gemini y en Google Docs, extendiendo su capacidad para convertir distintos tipos de contenido escrito en material sonoro apto para la escucha en distintos contextos.
Aunque la expansión reciente permite su uso en múltiples idiomas, el acceso completo a la función sigue estando limitado a suscriptores de los planes Gemini y Gemini Advanced.

La herramienta se basa en NotebookLM, el asistente de lectura y análisis de textos de Google. Desde allí, los usuarios pueden cargar documentos, informes académicos, análisis sectoriales o presentaciones corporativas, y generar automáticamente versiones sonoras de su contenido para su posterior consumo auditivo.
Esto permite procesar información de manera auditiva mientras se realizan otras actividades cotidianas, según explicó la empresa: “Puedes escuchar estas discusiones generadas por IA para obtener nuevos conocimientos y mantenerte informado, incluso mientras realizas múltiples tareas”.
Actualmente, los resúmenes generados en idiomas distintos del inglés están disponibles en fase experimental, y Google no ha especificado fechas concretas para una implementación global definitiva.

A diferencia de sistemas que se limitan a ofrecer transcripciones o resúmenes textuales, los ‘Resúmenes de audio’ integran elementos de síntesis, organización narrativa y locución artificial, imitando el ritmo, las pausas y la estructura de una conversación entre personas.
Entre los usos previstos se encuentran la revisión de apuntes académicos, el resumen de informes corporativos, la actualización de tendencias sectoriales o la preparación de presentaciones.
El contenido generado puede ser compartido o descargado para escucharlo en distintos momentos y dispositivos, sin necesidad de conocimientos técnicos avanzados ni experiencia previa en producción de audio.

La creación de voces artificiales a partir de texto no es una innovación reciente, pero su incorporación en herramientas de consumo masivo como Gemini podría enmarcar un cambio significativo en la forma de producir, consumir y distribuir información de manera automatizada.
Funciones como los ‘Resúmenes de audio’ automatizan procesos que, hasta ahora, requerían escritura, grabación y edición manual, tradicionalmente realizados por equipos humanos.
La disponibilidad en más de 50 idiomas marca un paso relevante en la estrategia de Google por integrar capacidades generativas de voz en sus servicios de productividad y comunicación, en un contexto donde la automatización de contenidos continúa expandiéndose en múltiples industrias tecnológicas, educativas y empresariales.
Últimas Noticias
El aire acondicionado no enfría, huele mal o hace ruido: conoce los daños más comunes y cómo repararlos
El mal funcionamiento del electrodoméstico suele ser por filtros sucios, falta de gas o problemas en el drenaje, que muchas veces se resuelven con mantenimiento básico

Un algoritmo, miles de fotos y un rescate: así la IA ayudó a encontrar a un montañista perdido
En solo cinco horas, dos drones recopilaron más de 2.600 imágenes de alta resolución, abarcando 183 hectáreas de terreno

El fin de una era de un grande sorprende al mundo: Sony se aparta del mercado de los Smart TV
El desarrollo de producto, diseño, fabricación, logística, ventas y servicio posventa quedará en otras manos

Ted: La Serie Temporada 2 de Universal+ está lista: fecha de estreno, sinopsis y más en Google
La nueva entrega amplía el universo de sus personajes y mantiene el humor irreverente que caracteriza a la serie

El debate que sacudió Davos: la inteligencia artificial general podría superar a los humanos en cinco años
Expertos señalan que el reto de adaptar instituciones y mercados es inédito y requerirá nuevas respuestas globales



