
Google ha presentado una función impulsada por inteligencia artificial (IA) que permite crear contenido en formato podcast sin necesidad de grabaciones humanas. Se trata de los ‘Resúmenes de audio’, una herramienta integrada a la plataforma Gemini, que genera discusiones en audio a partir de documentos o archivos cargados por el usuario.
Esta tecnología se basa en la generación automática de voces y guiones por medio de sistemas conversacionales. En este caso, Gemini produce una conversación entre dos presentadores de IA que simulan una discusión sobre el contenido proporcionado por el usuario, sin intervención humana en la locución ni en el diseño del diálogo.
PUBLICIDAD
Según explicó la empresa, “los ‘Resúmenes de audio’ transforman tus documentos, diapositivas e incluso informes de ‘Deep Research’ en discusiones de audio estilo podcast”. La herramienta fue concebida para facilitar el procesamiento de información compleja mediante resúmenes auditivos generados en lenguaje natural.

De acuerdo con la compañía, para realizar el producto, “Gemini creará una discusión estilo podcast entre dos presentadores de IA que se lanzarán a una conversación profunda y animada basada en los archivos cargados. Los locutores resumirán el material, establecerán conexiones entre temas, participarán en un intercambio dinámico y proporcionarán perspectivas únicas”.
PUBLICIDAD
La herramienta está disponible, en esta primera fase, para suscriptores de los planes Gemini y Gemini Advanced en idioma inglés. Sin embargo, Google informó que próximamente se habilitará en más idiomas, aunque no especificó fechas concretas.
Los usos previstos para esta función abarcan desde la revisión de apuntes académicos hasta el resumen de informes corporativos o análisis de tendencias sectoriales.
PUBLICIDAD

La empresa destacó su utilidad para personas que requieren procesar información mientras realizan otras actividades. “Puedes escuchar estas discusiones generadas por IA para obtener nuevos conocimientos y mantenerte informado, incluso mientras realizas múltiples tareas”, aseguran desde Google.
A diferencia de otros sistemas automatizados que generan únicamente transcripciones o extractos textuales, los ‘Resúmenes de audio’ de Gemini integran elementos de síntesis, organización narrativa y locución artificial, reproduciendo el ritmo y tono de una conversación entre humanos.
PUBLICIDAD
La herramienta se basa en NotebookLM, un asistente de lectura y análisis de textos lanzado por Google en 2023, que permite a los usuarios subir documentos y hacer preguntas sobre su contenido. Los ‘Resúmenes de audio’ representan una extensión de esa tecnología hacia formatos multimedia.

Con esta función, Google avanza en su estrategia de integrar capacidades generativas de voz dentro de sus plataformas de productividad, en un contexto donde la creación automatizada de contenido ha adquirido protagonismo en múltiples industrias.
PUBLICIDAD
El desarrollo de sistemas que generan locución artificial a partir de texto no es nuevo, pero la integración de esas capacidades en herramientas de consumo masivo representa un cambio en la forma en que se produce y distribuye información.
Hasta ahora, el proceso tradicional de creación de podcasts requería una serie de pasos manuales —desde la escritura del guion hasta la edición final—. Con funciones como los ‘Resúmenes de audio’, este flujo de trabajo puede realizarse de forma completamente automatizada.
PUBLICIDAD

Aunque la herramienta aún se encuentra limitada por idioma y acceso, su disponibilidad marca un hito en la automatización del formato podcast, en línea con una tendencia más amplia de producción de contenido sin intervención humana directa. Google promueve esta capacidad como una forma de “dar vida a tus ideas”, utilizando únicamente insumos textuales como punto de partida.
Por ahora, la función está disponible en la web y la aplicación móvil de Gemini. El contenido generado puede ser compartido o descargado para escucharse en distintos momentos. La plataforma no requiere conocimientos técnicos avanzados ni experiencia previa en producción de audio, lo que sugiere un posible impacto en el modelo actual de creación de contenidos sonoros.
PUBLICIDAD
PUBLICIDAD
PUBLICIDAD
Últimas Noticias
Google Traductor sumaría traducción de voz sin conexión a Internet
Para hacer uso de la traducción de voz sin conexión, será necesario descargar previamente los paquetes de idiomas requeridos

Del aprendizaje personalizado a la dependencia emocional y los deepfakes: cómo acompañar a los niños en el uso de la IA
La inteligencia artificial ya forma parte de la vida cotidiana de millones de chicos y adolescentes en América Latina, dentro y fuera de las aulas. Mientras transforma la manera de estudiar, informarse y relacionarse, especialistas advierten sobre los riesgos vinculados al uso de estas tecnologías

¿Cuándo cambiar de carril?: la nueva IA de Google para autos ahora te avisa en tiempo real
La compañía aclaró que Live Lane Guidance estará disponible en ciertos modelos de automóviles que incorporan el sistema Google built-in

Alemania cubre un lago con paneles solares verticales y resulta en un éxito rotundo: este es el motivo
La instalación redujo el consumo eléctrico de la cantera en casi un 60% durante la fase inicial

Esta es la verdadera función de los agujeros en los enchufes eléctricos
Este diseño fue ideado en 1904 por el inventor Harvey Hubbell II para mejorar la seguridad eléctrica




