
Google DeepMind ha presentado dos nuevos modelos que llevan la inteligencia artificial al mundo físico a través de la robótica, ambos basados en Gemini 2.0, para que los robots puedan realizar una mayor variedad de tareas complejas.
La inteligencia artificial ha demostrado una serie de capacidades para resolver problemas complejos utilizando el razonamiento multimodal. Sin embargo, estos avances se han limitado al mundo digital, sin llegar a transferir estas habilidades al mundo físico.
Para salvar esta brecha, Google DeepMind ha presentado Gemini Robotics y Gemini Robotics-ER, dos modelos de visión-lenguaje basados en Gemini 2.0 que permiten que los robots realicen "una gama de tareas reales más amplia que nunca", como explican en blog de la compañía.
Gemini Robotics es, concretamente, un modelo avanzado de visión-lenguaje-acción (VLA) que incorpora acciones físicas como nueva modalidad para controlar directamente a los robots. Ello permite abordar tareas extremadamente complejas y de varios pasos que requieren una manipulación precisa, como plegar un origami o meter un bocadillo en una bolsa con cierre de zip.
Por su parte, Gemini Robotics-ER es un modelo de visión-lenguaje (VLM) con una comprensión espacial avanzada, que permite ejecutar programas utilizando el razonamiento corporal de Gemini. Con ello, mejora capacidades como la de apuntar y la detección 3D para, por ejemplo, intuir un agarre adecuado para coger una taza de café por el asa y una trayectoria segura para acercarse a ella.
Además, Google DeepMind ha anunciado una asociación con Apptronik para crear la próxima generación de robots humanoides. Agile Robots, Agility Robots, Boston Dynamics y Enchanted Tools también han podido acceder a Gemini Robotics-ER.
Últimas Noticias
La Guardia Revolucionaria iraní asegura que son ya 560 los militares estadounidenses muertos o heridos
Según un comunicado oficial, el cuerpo militar iraní informa que cientos de soldados estadounidenses han resultado muertos o heridos debido a ataques recientes con misiles y drones en Oriente Medio, mientras aumenta la tensión regional por las represalias cruzadas

El Rey cree que la tecnología debe "formar parte de un marco ético" como herramienta para la conexión
Durante la inauguración del Mobile World Congress, Felipe VI instó a que los avances digitales potencien la cohesión social y el bienestar, subrayando la necesidad de responsabilidad en el uso de la inteligencia artificial y la innovación para impulsar el desarrollo humano

Francia, Alemania y Reino Unido amenazan con atacar las lanzaderas de misiles y drones de Irán
En una declaración conjunta, los principales países europeos instan a Irán a cesar sus ofensivas en Oriente Próximo y advierten que podrían tomar medidas directas para eliminar amenazas que ponen en peligro a socios y ciudadanos occidentales

La UE pide "máxima contención" en Irán y aboga por la desescalada
Los cancilleres del bloque europeo alertan sobre el riesgo de una escalada armada y exhortan a Teherán a cesar acciones hostiles, proteger civiles, cooperar con el OIEA y mantener rutas marítimas abiertas para evitar consecuencias globales

(Crónica) La Cartuja reparte el derbi y el Valencia gana vida
Oportunidad para el conjunto 'che', que sumó tres puntos fundamentales ante Osasuna y se aleja del descenso, mientras que Betis y Sevilla desperdiciaron ventajas en uno de los duelos más vibrantes de la jornada en la capital andaluza
