Google presenta Whisk, su nueva IA capaz de crear videos usando imágenes

Los usuarios cuentan con la posibilidad de subir sus propias fotografías o generarlas con inteliegencia artificial

Por Isabela Durán San Juan

Guardar

Whisk cuenta con la capacidad de generar videos a partir de imágenes. (Google)

Google ha presentado Whisk, una inteligencia artificial capaz de generar videos utilizando imágenes como punto de partida. A diferencia de otras herramientas que dependen únicamente de comandos o prompts, como “genera un video de un gato blanco acostado en una cama”, Whisk permite al usuario subir una foto del gato y añadir una descripción para personalizar el video.

La plataforma funciona en tres etapas: el sujeto del video, la escena y el estilo. En cada uno de estos pasos, los usuarios pueden:

Subir una foto propia.
Generar una imagen con IA directamente en la plataforma.
Seleccionar una imagen disponible en el sitio.

Por último, deben ingresar una descripción que complemente la creación del video. Si el resultado no es el esperado, Whisk incluye la opción ‘Refine’, que permite realizar ajustes. Al seleccionar esta función, los usuarios pueden agregar una nueva descripción con los cambios deseados. Una vez finalizado, solo deben pulsar el ícono de descarga (una flecha hacia abajo) para guardar el video.

Los usuarios cuentan con la

Los usuarios cuentan con la capacidad de subir sus propias fotos o generalas con IA. (Google)

Para ingresar a Whisk, la nueva IA de Google, los usuarios deben ingresar a la siguiente página: https://blog.google/technology/google-labs/whisk/.

Deben iniciar sesión con una cuenta personal de Google así como encontrarse en Estados Unidos, es el único país en el que esta herramienta se encuentra disponible, por el momento.

Google Labs es el espacio donde Google presenta sus más recientes experimentos con inteligencia artificial y permite a los usuarios dar retroalimentación para perfeccionar estas herramientas.

“En Google Labs, desarrollamos experimentos con los últimos modelos de IA generativa, como Gemini, Imagen y Veo. Nuestro objetivo es recibir comentarios sobre nuevos productos y funciones, mientras trabajamos en conjunto para dar forma a la tecnología”, explicaron Thomas Iljic, director de gestión de productos en Google Labs, y Nicole Brichtova, gerente de producto en Google DeepMind.

Whisk se aloja en la

Whisk se aloja en la página de Google Labs en Estados Unidos. (Google)

Dado que Whisk es un experimento reciente de Google Labs, Iljic y Brichtova advierten que la herramienta “extrae solo algunas características clave de la imagen, por lo que es posible que genere resultados que difieran de las expectativas”.

“Whisk puede no cumplir por completo tus necesidades. Por esta razón, te permitimos ver y editar las indicaciones subyacentes en cualquier momento”, señalan.

No obstante, en sus primeras pruebas con artistas y creativos, Whisk ha sido descrito como una herramienta creativa innovadora, y no como un editor de imágenes tradicional.

“Lo diseñamos para facilitar una exploración visual rápida, no para lograr ediciones perfectas. Se trata de explorar ideas de formas nuevas y creativas, permitiéndote trabajar con docenas de opciones y descargar las que más te gusten”, afirmaron los responsables del proyecto.

Gemini 2.0 cuenta con la

Gemini 2.0 cuenta con la capacidad de realizar multiples tareas a la vez. (Google)

Gemini 2.0 es el modelo de inteligencia artificial más avanzado y rápido hasta la fecha de Google. Esta IA permite realizar múltiples tareas simultáneamente con mayor autonomía, reduciendo la necesidad de supervisión humana.

Por ejemplo, un usuario puede emplear Gemini 2.0 para recopilar y organizar artículos científicos, estadísticas y tendencias globales de manera simultánea. Integra capacidades de generación de imágenes, permitiendo crear contenido gráfico a partir de descripciones textuales proporcionadas por los usuarios.

Según Sundar Pichai, director ejecutivo de Google y Alphabet, “si Gemini 1.0 se centraba en organizar y comprender la información, Gemini 2.0 se centra en hacerla mucho más útil”.

Gemini 2.0 solo está disponible

Gemini 2.0 solo está disponible en su página web. (Gemini)

Demis Hassabis, director ejecutivo de Google DeepMind, y Koray Kavukcuoglu, director de tecnología de Google DeepMind, explican que este modelo puede admitir entradas multimodales como imágenes, video y audio, y generar resultados en varios formatos.

Además, puede buscar información en Google, ejecutar programas y utilizar herramientas de terceros, lo que lo hace ideal para tareas como analizar un video educativo, resumirlo en texto con gráficos y generar una presentación con narración en diferentes idiomas.

Los ejecutivos de Google señalaron que pronto estará disponible en la aplicación móvil de Gemini y que a principios del próximo año se ampliará Gemini 2.0 a más productos de Google.

Para utilizar Gemini 2.0, los usuarios pueden acceder a la página web de Gemini, seleccionar ‘2.0 Flash Experimental’ y comenzar a interactuar con la nueva IA de Google.

Google Inteligencia artificial Videos con IA Tecnología Lo último en tecnología

Últimas Noticias

Qué hacer si me llaman números desconocidos a cada rato

La opción más eficaz es bloquear o silenciar estos números, ya que así se disminuye la posibilidad de ser víctima de fraudes o actividades delictivas

Clash Royale premiará a jugadores que ganen partidas con sus pantallas rotas

Los ganadores pueden recibir recompensas como cartas legendarias y banners únicos dentro del juego

Cómo se vería un capibara en el universo de Sonic y Fortnite, según la IA

Nano Banana de Google cuenta con la capacidad de generar imágenes a partir de descripciones textuales, adaptando elementos visuales de distintos universos en segundos

Los 10 animes más vistos en Crunchyroll para maratonear

Estas son las series que han ganado popularidad en la plataforma de streaming que apuesta fuertemente por las producciones japonesas

Game of Thrones llega a Fortnite: así lucen las skins de Jon Snow y Daenerys

Esta es la primera colaboración de Fortnite que se presenta tras el aumento en el precio de los paVos y el regreso global del juego a la Google Play Store

Defensa y Justicia recibe a Unión en busca de ser escolta de la Zona A del Torneo Apertura: la agenda completa

La increíble atajada de Pickford ante Enzo Fernández en una nueva derrota del Chelsea por la Premier League

Murió el campeón Cherquis Bialo, nació la leyenda del periodismo: el último adiós a un referente

Tenso cruce de Martín Demichelis con un periodista tras la derrota del Mallorca: “Ocupate de lo tuyo y no de lo mío”

Impacto en el Gran Premio de Brasil del MotoGP por la aparición de un enorme agujero en medio de la recta principal

Roberto García Moritán habló de su separación con Pampita: “Perdí todo”

Mauro Icardi se reencontró con sus dos hijas luego de tres meses sin verlas

El explosivo look con que Emilia Attias celebró sus 39 años: los excompañeros de MasterChef presentes y el beso con su novio

El inesperado regalo de Abel Pintos que emocionó a una participante de Es mi sueño: “Te va a quedar más lindo que a mí”

El video inédito de Los Piojos para despedir a Dani Buira: “Soy feliz cada vez que toco”

INFOBAE AMÉRICA

Costa Rica y El Salvador abren con victoria el Pre-Clasificatorio Centroamericano al FIBA AmeriCup 2029

Conozca los requisitos para obtener la nueva cédula de identidad en República Dominicana

Panamá casi triplicó su deuda en diez años y superó la barrera de los $60 mil millones en febrero

Descartes, el arquitecto del racionalismo moderno: entre la duda metódica y las pasiones del alma

Se extiende la alerta por inundaciones repentinas en Hawái por la amenaza de la presa Wahiawa