Así es Gemini Omni: la IA de Google que te ayudará a crear videos usando imágenes, audio y más

Campaña promocional de Gemini Omni, una tecnología de Google DeepMind.

Google presnetó Gemini Omni, un nuevo modelo multimodal capaz de entender y generar contenido de video, imagen, texto y audio de manera integrada.

La presentación de esta tecnología durante el evento Google I/O 2026 marca un hito en la estrategia de la compañía frente al avance de empresas en el sector de la IA generativa.

Qué es Google Omni y cómo funciona

Gemini Omni es la última apuesta de Google DeepMind en el terreno de la inteligencia artificial generativa. Se trata de un modelo denominado “Modelo del Mundo”, diseñado para comprender simultáneamente lenguaje, imágenes, audio y video, permitiendo una interacción fluida y natural con el usuario.

Según Demis Hassabis, director ejecutivo de Google DeepMind, el objetivo es claro: “crear cualquier cosa a partir de cualquier entrada”.

Gemini Omni permite crear videos a partir de fotografías, descripciones de texto y pistas de audio, generando contenido cohesivo y personalizado. (Google)

A diferencia de plataformas anteriores, Gemini Omni es nativamente multimodal. Esto significa que puede tomar como referencia cualquier combinación de imágenes, textos, videos o audios, y producir contenido cohesivo que responde a las instrucciones del usuario.

Por ejemplo, es posible subir una fotografía, añadir un texto descriptivo y una pista de audio, y pedirle a Omni que genere un video que combine todos estos elementos de manera coherente.

El primer modelo disponible dentro de esta familia es Gemini Omni Flash, que permite la creación de clips de hasta 10 segundos con video y audio. Esta herramienta destaca por su capacidad para editar y transformar videos usando simplemente lenguaje natural, lo que supone un avance respecto a los sistemas tradicionales de texto a video.

Gemini Omni permite al usuario modificar fondos, introducir efectos especiales, alterar ángulos de cámara o cambiar detalles concretos dentro de una escena, todo ello a través de instrucciones conversacionales. Además, mantiene la coherencia de los personajes, la física de los movimientos y la memoria de los cambios realizados en la secuencia, facilitando una edición mucho más intuitiva.

Con Gemini Omni, los usuarios pueden modificar fondos, añadir efectos especiales y transformar escenas con gran precisión y coherencia.

Para qué sirve y posibilidades de uso de Gemini Omni

La utilidad de Gemini Omni se extiende tanto a la creación de contenido original como a la edición de material ya existente. Un usuario puede grabar un video y pedirle al modelo que transforme la acción, agregue nuevos objetos o personajes, o reinterprete la escena bajo un nuevo estilo o contexto.

Por ejemplo, se puede solicitar que una escultura aparezca hecha de burbujas, o que el reflejo de un espejo se convierta en líquido cuando una persona lo toca.

Otra de las funciones destacadas es la capacidad para refinar videos en múltiples etapas. Es posible realizar una primera edición, visualizar el resultado y, posteriormente, añadir nuevas instrucciones para modificar el entorno, el estilo visual, los efectos de movimiento o cualquier detalle específico, sin perder la coherencia con la edición original.

Gemini Omni también es capaz de generar explicaciones visuales complejas a partir de indicaciones breves. Por ejemplo, puede crear un video estilo claymation para explicar el proceso de plegamiento de proteínas, o producir secuencias educativas que integren referencias históricas, científicas o culturales, aprovechando el conocimiento contextual del modelo.

Google habilitará el acceso a Gemini Omni para desarrolladores vía API y ofrece el nuevo plan AI Ultra por 100 dólares mensuales.(REUTERS/Carlos Barria/File Photo)

Cómo se podrá acceder a Google Omni

El despliegue de Gemini Omni ha comenzado con el modelo Omni Flash, disponible desde este martes para los usuarios de los planes Google AI Plus, Pro y Ultra, a través de la aplicación Gemini y Google Flow. Próximamente, la tecnología llegará también a YouTube Shorts y YouTube Create, donde estará disponible de forma gratuita.

Para quienes deseen utilizar Omni con fines profesionales o integrarlo en desarrollos propios, Google ha anunciado que en las próximas semanas habilitará el acceso mediante API para desarrolladores y empresas. Por el momento, no se ha confirmado una fecha oficial para esta segunda etapa.

El nuevo plan AI Ultra de Google tendrá un costo de 100 dólares mensuales, ofreciendo límites de uso más elevados. El plan anterior, de 250 dólares, reducirá su precio a 200 dólares, lo que busca ampliar el acceso a la herramienta en distintos segmentos de usuarios.

Más Noticias

Cansado de los mosquitos, creó un sistema láser con IA y consiguió erradicarlos de su casa

La tecnología busca ofrecer una alternativa a repelentes e insecticidas mediante un sistema capaz de operar incluso en la oscuridad

Tomb Raider, Mafia III y más: los 15 juegos de Amazon Prime Gaming m[as buscados

Los suscriptores de Amazon Prime podrán reclamar títulos de acción, estrategia y rol que se irán habilitando durante todo el mes

Steam ofrece gratis un título inspirado en Metroid y Ninja Gaiden: así lo puedes añadir a tu PC

La promoción permite sumar el juego a la biblioteca sin pagar y conservarlo de forma permanente, impulsada por el anuncio de Gravity Circuit 2

El reto de la IA en América Latina: Por qué el 90% de los proyectos no superan la prueba de concepto

Dave Levy, vicepresidente del Sector Público Mundial de AWS, advierte que implementar proyectos de IA en gobiernos y empresas a gran escala no es lo mismo que usar un chatbot como asistente básico

Así es Gemini Omni: la IA de Google que te ayudará a crear videos usando imágenes, audio y más

Este modelo permite explicar conceptos con videos educativos, integrando conocimiento contextual y referencias históricas o científicas

Qué es Google Omni y cómo funciona

Para qué sirve y posibilidades de uso de Gemini Omni

Cómo se podrá acceder a Google Omni

Más Noticias

Cansado de los mosquitos, creó un sistema láser con IA y consiguió erradicarlos de su casa

La tecnología busca ofrecer una alternativa a repelentes e insecticidas mediante un sistema capaz de operar incluso en la oscuridad

Tomb Raider, Mafia III y más: los 15 juegos de Amazon Prime Gaming m[as buscados

Los suscriptores de Amazon Prime podrán reclamar títulos de acción, estrategia y rol que se irán habilitando durante todo el mes

Steam ofrece gratis un título inspirado en Metroid y Ninja Gaiden: así lo puedes añadir a tu PC

La promoción permite sumar el juego a la biblioteca sin pagar y conservarlo de forma permanente, impulsada por el anuncio de Gravity Circuit 2

El reto de la IA en América Latina: Por qué el 90% de los proyectos no superan la prueba de concepto

Dave Levy, vicepresidente del Sector Público Mundial de AWS, advierte que implementar proyectos de IA en gobiernos y empresas a gran escala no es lo mismo que usar un chatbot como asistente básico

Cinco dispositivos que no debes comprar fácil en Amazon y Temu: muchos no funcionan

En plataformas como AliExpress se ofrecen artículos génericos que luego no funcionan como debe ser

Qué es Google Omni y cómo funciona

Para qué sirve y posibilidades de uso de Gemini Omni

Cómo se podrá acceder a Google Omni

Temas Relacionados

Más Noticias

Cansado de los mosquitos, creó un sistema láser con IA y consiguió erradicarlos de su casa

La tecnología busca ofrecer una alternativa a repelentes e insecticidas mediante un sistema capaz de operar incluso en la oscuridad

Tomb Raider, Mafia III y más: los 15 juegos de Amazon Prime Gaming m[as buscados

Los suscriptores de Amazon Prime podrán reclamar títulos de acción, estrategia y rol que se irán habilitando durante todo el mes

Steam ofrece gratis un título inspirado en Metroid y Ninja Gaiden: así lo puedes añadir a tu PC

La promoción permite sumar el juego a la biblioteca sin pagar y conservarlo de forma permanente, impulsada por el anuncio de Gravity Circuit 2

El reto de la IA en América Latina: Por qué el 90% de los proyectos no superan la prueba de concepto

Dave Levy, vicepresidente del Sector Público Mundial de AWS, advierte que implementar proyectos de IA en gobiernos y empresas a gran escala no es lo mismo que usar un chatbot como asistente básico

Cinco dispositivos que no debes comprar fácil en Amazon y Temu: muchos no funcionan

En plataformas como AliExpress se ofrecen artículos génericos que luego no funcionan como debe ser