
Google ha presentado una función impulsada por inteligencia artificial (IA) que permite crear contenido en formato podcast sin necesidad de grabaciones humanas. Se trata de los ‘Resúmenes de audio’, una herramienta integrada a la plataforma Gemini, que genera discusiones en audio a partir de documentos o archivos cargados por el usuario.
Esta tecnología se basa en la generación automática de voces y guiones por medio de sistemas conversacionales. En este caso, Gemini produce una conversación entre dos presentadores de IA que simulan una discusión sobre el contenido proporcionado por el usuario, sin intervención humana en la locución ni en el diseño del diálogo.
PUBLICIDAD
Según explicó la empresa, “los ‘Resúmenes de audio’ transforman tus documentos, diapositivas e incluso informes de ‘Deep Research’ en discusiones de audio estilo podcast”. La herramienta fue concebida para facilitar el procesamiento de información compleja mediante resúmenes auditivos generados en lenguaje natural.

De acuerdo con la compañía, para realizar el producto, “Gemini creará una discusión estilo podcast entre dos presentadores de IA que se lanzarán a una conversación profunda y animada basada en los archivos cargados. Los locutores resumirán el material, establecerán conexiones entre temas, participarán en un intercambio dinámico y proporcionarán perspectivas únicas”.
PUBLICIDAD
La herramienta está disponible, en esta primera fase, para suscriptores de los planes Gemini y Gemini Advanced en idioma inglés. Sin embargo, Google informó que próximamente se habilitará en más idiomas, aunque no especificó fechas concretas.
Los usos previstos para esta función abarcan desde la revisión de apuntes académicos hasta el resumen de informes corporativos o análisis de tendencias sectoriales.

La empresa destacó su utilidad para personas que requieren procesar información mientras realizan otras actividades. “Puedes escuchar estas discusiones generadas por IA para obtener nuevos conocimientos y mantenerte informado, incluso mientras realizas múltiples tareas”, aseguran desde Google.
PUBLICIDAD
A diferencia de otros sistemas automatizados que generan únicamente transcripciones o extractos textuales, los ‘Resúmenes de audio’ de Gemini integran elementos de síntesis, organización narrativa y locución artificial, reproduciendo el ritmo y tono de una conversación entre humanos.
La herramienta se basa en NotebookLM, un asistente de lectura y análisis de textos lanzado por Google en 2023, que permite a los usuarios subir documentos y hacer preguntas sobre su contenido. Los ‘Resúmenes de audio’ representan una extensión de esa tecnología hacia formatos multimedia.
PUBLICIDAD

Con esta función, Google avanza en su estrategia de integrar capacidades generativas de voz dentro de sus plataformas de productividad, en un contexto donde la creación automatizada de contenido ha adquirido protagonismo en múltiples industrias.
El desarrollo de sistemas que generan locución artificial a partir de texto no es nuevo, pero la integración de esas capacidades en herramientas de consumo masivo representa un cambio en la forma en que se produce y distribuye información.
PUBLICIDAD
Hasta ahora, el proceso tradicional de creación de podcasts requería una serie de pasos manuales —desde la escritura del guion hasta la edición final—. Con funciones como los ‘Resúmenes de audio’, este flujo de trabajo puede realizarse de forma completamente automatizada.

Aunque la herramienta aún se encuentra limitada por idioma y acceso, su disponibilidad marca un hito en la automatización del formato podcast, en línea con una tendencia más amplia de producción de contenido sin intervención humana directa. Google promueve esta capacidad como una forma de “dar vida a tus ideas”, utilizando únicamente insumos textuales como punto de partida.
PUBLICIDAD
Por ahora, la función está disponible en la web y la aplicación móvil de Gemini. El contenido generado puede ser compartido o descargado para escucharse en distintos momentos. La plataforma no requiere conocimientos técnicos avanzados ni experiencia previa en producción de audio, lo que sugiere un posible impacto en el modelo actual de creación de contenidos sonoros.
PUBLICIDAD
PUBLICIDAD
Últimas Noticias
Dónde ver el partido Paraguay vs. Alemania, a qué hora juegan y más preguntas trend en Google
Uno de los recuerdos más recurrentes en las búsquedas sobre la selección paraguaya está vinculado a su participación en el Mundial de Sudáfrica 2010

Tu celular puede acceder al Wi-Fi sin contraseña y de forma instantánea
Muchos routers modernos incluyen un código QR visible en alguna parte del aparato, generalmente en la parte inferior

Feliz cumpleaños Elon Musk: cuántos años tiene, cuántos hijos, por qué es billonario y todo su emporio
El año 2026 marca un hito en la historia de la riqueza global: elmagnate se convierte en el primer billonario del mundo tras la salida a bolsa de SpaceX

Instala tu propia Steam Machine en tu PC con SteamOS 3.8 sin costo
Mientras se desarrolla el soporte para nuevas tarjetas gráficas, la versión actual de SteamOS ya ofrece un desempeño fluido para quienes conectan su equipo a un televisor

La nueva recuperación de Windows 11 exige sacrificar almacenamiento, no dinero
Point-in-time Restore es la nueva apuesta de Microsoft para mejorar la protección ante fallos del sistema




