
Ya no es necesario escribir guiones ni grabar voces para producir un podcast. Google amplió las capacidades de su herramienta de inteligencia artificial (IA) que genera resúmenes de audio, permitiendo ahora su uso en más de 50 idiomas, incluidos español, portugués, francés, turco, coreano y chino.
La función, disponible a través de la plataforma Gemini y la aplicación NotebookLM, convierte documentos, presentaciones y archivos en conversaciones de audio simuladas entre dos presentadores de IA.
Hasta hace poco, esta tecnología solo operaba en inglés, pero ahora es posible configurar el idioma de salida desde la sección de ajustes en NotebookLM, tanto en su versión web como en dispositivos móviles.

Para cambiar de idioma, los usuarios deben dirigirse a NotebookLM, seleccionar la configuración ubicada en la esquina superior derecha de la pantalla y elegir “Idioma de salida”.
Desde allí, se puede seleccionar el idioma preferido para recibir respuestas, escuchar los resúmenes en formato de audio y ajustar otros parámetros de salida de la conversación generada.
Cómo funcionan los ‘Resúmenes de audio’ de Google
Los ‘Resúmenes de audio’ transforman documentos, diapositivas e incluso informes de investigación extensos en discusiones estilo podcast.

La tecnología genera de forma automática las voces y los guiones a través de sistemas conversacionales que permiten simular una discusión profunda basada en el contenido proporcionado. La locución y el diseño del diálogo no requieren intervención humana en ningún momento del proceso.
Desde su lanzamiento inicial en 2023, Audio Overviews —nombre que recibe esta función en inglés— ha sido incorporado en diversas plataformas de Google. Además de NotebookLM, la herramienta está disponible en el chatbot Gemini y en Google Docs, extendiendo su capacidad para convertir distintos tipos de contenido escrito en material sonoro apto para la escucha en distintos contextos.
Aunque la expansión reciente permite su uso en múltiples idiomas, el acceso completo a la función sigue estando limitado a suscriptores de los planes Gemini y Gemini Advanced.

La herramienta se basa en NotebookLM, el asistente de lectura y análisis de textos de Google. Desde allí, los usuarios pueden cargar documentos, informes académicos, análisis sectoriales o presentaciones corporativas, y generar automáticamente versiones sonoras de su contenido para su posterior consumo auditivo.
Esto permite procesar información de manera auditiva mientras se realizan otras actividades cotidianas, según explicó la empresa: “Puedes escuchar estas discusiones generadas por IA para obtener nuevos conocimientos y mantenerte informado, incluso mientras realizas múltiples tareas”.
Actualmente, los resúmenes generados en idiomas distintos del inglés están disponibles en fase experimental, y Google no ha especificado fechas concretas para una implementación global definitiva.

A diferencia de sistemas que se limitan a ofrecer transcripciones o resúmenes textuales, los ‘Resúmenes de audio’ integran elementos de síntesis, organización narrativa y locución artificial, imitando el ritmo, las pausas y la estructura de una conversación entre personas.
Entre los usos previstos se encuentran la revisión de apuntes académicos, el resumen de informes corporativos, la actualización de tendencias sectoriales o la preparación de presentaciones.
El contenido generado puede ser compartido o descargado para escucharlo en distintos momentos y dispositivos, sin necesidad de conocimientos técnicos avanzados ni experiencia previa en producción de audio.

La creación de voces artificiales a partir de texto no es una innovación reciente, pero su incorporación en herramientas de consumo masivo como Gemini podría enmarcar un cambio significativo en la forma de producir, consumir y distribuir información de manera automatizada.
Funciones como los ‘Resúmenes de audio’ automatizan procesos que, hasta ahora, requerían escritura, grabación y edición manual, tradicionalmente realizados por equipos humanos.
La disponibilidad en más de 50 idiomas marca un paso relevante en la estrategia de Google por integrar capacidades generativas de voz en sus servicios de productividad y comunicación, en un contexto donde la automatización de contenidos continúa expandiéndose en múltiples industrias tecnológicas, educativas y empresariales.
Últimas Noticias
Demandan a Valve por su sistema de cajas de botín: acusan a la compañía de fomentar el juego de azar digital
La compañía detrás de Steam es acusada de incentivar prácticas similares al juego de azar a través de sistemas de recompensas aleatorias

Valor de BNB y otras principales criptomonedas para este 11 de marzo
El bitcoin, una de las principales criptomonedas, registra un precio de 69.510,19 dólares

Entre la nostalgia y el reclamo de los fanáticos, ¿podría volver el clásico Hit and Run de Los Simpson?
La posible reedición enfrenta obstáculos técnicos y legales, mientras el equipo creativo evalúa opciones para satisfacer la demanda global por el legendario videojuego

Cómo hacer que tu Smart TV sea más fluida y eficiente
Mantener el sistema operativo al día es una de las acciones más directas para mejorar la fluidez de la TV

Por qué algunas personas explican todo lo que hacen en su vida cotidiana, según la IA
La primera razón que destaca Gemini tiene raíz emocional y se relaciona con los mecanismos de defensa




