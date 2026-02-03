Un robot humanoide impulsado por la tecnología Cosmos Policy interactúa con una mujer, lanzándole una pelota roja en un entorno de oficina moderno (Nvidia)

Nvidia presentó recientemente una tecnología que promete transformar la robótica al permitir que los robots anticipen escenarios futuros antes de actuar. Denominada Cosmos Policy, esta innovación introduce una nueva forma de planificar y controlar sistemas autónomos, con el objetivo de mejorar su desempeño en entornos físicos cambiantes.

La presentación forma parte del ecosistema Cosmos, enfocado en el desarrollo de modelos de mundo capaces de comprender la evolución temporal del entorno y facilitar la toma de decisiones complejas.

La propuesta de Nvidia se apoya en el uso de grandes volúmenes de datos visuales para que los sistemas aprendan cómo cambia la realidad y utilicen ese aprendizaje al planificar acciones. Esta aproximación permite a los robots actuar de forma menos reactiva y más estratégica, acercando la inteligencia artificial (IA) a un nivel de toma de decisiones más autónomo y eficiente.

Un robot humanoide equipado con un casco de seguridad blanco realiza una tarea de manipulación precisa, destacando las capacidades de la tecnología Cosmos Policy de Nvidia en un entorno de laboratorio (Nvidia)

Un nuevo paradigma en el control robótico

En el campo de la robótica, una política de control es el mecanismo encargado de traducir observaciones captadas por cámaras y sensores en movimientos físicos concretos. Tradicionalmente, estas políticas han sido diseñadas como redes neuronales específicas para cada tarea, lo que requiere módulos independientes para percepción, planificación y control. Este enfoque suele depender de grandes cantidades de datos etiquetados y una personalización intensiva para cada robot o ambiente.

La Cosmos Policy de Nvidia introduce una arquitectura diferente al reutilizar un modelo de predicción de vídeo previamente entrenado, conocido como Cosmos Predict. Durante la etapa de adaptación, las acciones del robot, los estados físicos y los resultados de las tareas se integran en una representación temporal común. Esta integración simplifica la arquitectura y permite al sistema anticipar de manera conjunta las acciones futuras, los estados que derivarán de ellas y la probabilidad de éxito de cada tarea.

El sistema logró altas tasas de éxito en pruebas de manipulación robótica que requieren razonamiento a largo plazo, según los resultados compartidos por la compañía. En algunos casos, la eficiencia alcanzada fue comparable o superior a la de métodos existentes, utilizando un número menor de demostraciones, un dato especialmente relevante en un sector donde la recolección de datos reales es costosa y demanda tiempo.

Robots equipados con Cosmos Policy pueden anticipar resultados antes de actuar. (Imagen Ilustrativa Infobae)

La clave de este avance reside en la capacidad de la tecnología para realizar planificación durante la ejecución en tiempo real. En lugar de limitarse a la próxima acción inmediata, el modelo puede generar y evaluar múltiples secuencias de acciones posibles, seleccionando la opción más adecuada según las consecuencias previstas y la probabilidad de éxito.

Planificación, eficiencia y transferencia a entornos reales

La planificación en tiempo de ejecución distingue a Cosmos Policy de otras propuestas previas. El modelo no solo evalúa el siguiente paso, sino que prevé varias alternativas a futuro, calculando los posibles resultados y el éxito esperado de cada camino. Esto permite a los robots comportarse de forma menos reactiva ante cambios imprevistos y más estratégica en la resolución de tareas complejas.

Durante experimentos en entornos reales, la tecnología fue capaz de completar tareas de manipulación bimanual directamente a partir de información visual. Este desempeño sugiere que el enfoque de Nvidia puede transferirse más allá de simulaciones, facilitando la implementación en robots que interactúan con el mundo físico.

Nvidia busca estandarizar la toma de decisiones robóticas con modelos predictivos. (Europa Press)

Cosmos Policy forma parte de un esfuerzo más amplio por parte de Nvidia para construir modelos de mundo generalistas que sirvan como infraestructura compartida para robots y sistemas autónomos. La meta es reducir la necesidad de ingeniería específica para cada tarea, permitiendo que las máquinas comprendan, predigan y actúen en el entorno físico con mayor autonomía.

La nueva tecnología no actúa como un estándar de seguridad ni como normativa, sino que se posiciona como una base técnica sobre la que desarrollar sistemas de control más avanzados. Las cuestiones relacionadas con la seguridad, el cumplimiento normativo y la gobernanza seguirán dependiendo de sistemas superiores y reguladores externos.