El agente Operator de OpenAI tiene capacidades humanas para navegar y ejecutar tareas en internet

OpenAI presenta Operator, un agente que combina GPT-4o con razonamiento avanzado, capaz de ejecutar tareas en internet de forma autónoma y segura, adaptándose a entornos digitales variados

Guardar

OpenAI ha presentado la versión preliminar de Operator, un agente que combina las capacidades del modelo GPT-4o con un razonamiento avanzado a través del aprendizaje y puede interactuar con interfaces gráficas de usuario (GUI, por sus siglas en inglés) para navegar por internet de forma autónoma, como si se tratara de un humano.

Esta herramienta funciona con un nuevo modelo denominado Computer-Using Agent (CUA) y se basa "en años de investigación fundamental en la intersección entre la comprensión y el razonamiento multimodal", según ha explicado la desarrolladora en un comunicado.

Al combinar la percepción avanzada de la interfaz gráfica de usuario con la resolución de problemas, este CUA es capaz de dividir las tareas para ejecutarlas en varios pasos, adaptarse de forma dinámica cuando surgen cambios inesperados y autocorregirse si ejecuta alguna acción de forma incorrecta.

Más concretamente, el modelo, que combina GPT-4o con un razonamiento avanzado, procesa datos de los píxeles de la pantalla para comprender lo que sucede en ella y utiliza un ratón y un teclado virtual para completar las acciones de forma autónoma, con acciones como hacer clic, desplazarse o escribir.

De este modo, puede actuar con capacidades humanas en una amplia gama de entornos digitales, interactuar con botones, menús y campos de texto (GUI), realizar tareas como complementar formularios y navegar por sitios web sin necesidad de interfaces de programación de aplicaciones (API) especializadas.

No obstante, la compañía tecnológica ha señalado que aunque este modelo maneja la mayoría de los pasos de forma automática, busca la confirmación del usuario para acciones snesibles. Por ejemplo, ingresar datos de inicio de sesión, responder formularios CAPTCHA o ejecutar una transacción bancaria.

Debido a estas capacidades, OpenAI ha señalado que su nuevo trabajo "marca el siguiente paso en el desarrollo de la IA, debido a que permite que los modelos utilicen las mismas herramientas de las que dependen los humanos a diario y abre la puerta a una amplia gama de nuevas aplicaciones".

CUA aún se encuentra en una etapa temprana de desarrollo y tiene algunas limitaciones. Asimismo, está avalado por WebArena y WebVoyager, logrando una tasa de éxito del 58,1 por ciento en la primera y un 87 por ciento en la segunda.

Por otra parte, OpenAI ha señalado que OSWorld, un punto de referencia que evalúa la capacidad de los modelos para controlar sistemas operativos completos, como Ubuntu, Windows y macOS, le ha otorgado una tasa de éxito del 38,1 por ciento. No obstante, la compañía ha observado un escalamiento en tiempo de prueba. lo que quiere decir que el rendimiento de modelo mejora cuando debe ejecutar más pasos o acciones.

La firma también ha subrayado que CUA se ha desarrollado con la seguridad como máxima prioridad para abordar los desafíos que plantea el acceso de un agente al mundo real. De esta manera, está entrenado para rechazar tareas dañinas y actividades ilegales o irregulares.

Tampoco puede acceder a sitios web que la propia OpenAI ha bloqueado de forma preventiva, como webs de contenidos para adultos o juegos de azar, y es capaz de identificar actividades fraudulentas. De ese modo, monitoriza la actividad y pausa la ejecución de una acción si detecta contenido sospechoso en el panel.

Por el momento, este agente se está implementando a través de una vista previa de investigación a través de operator.chatgpt.com y ya tienen acceso a él los suscriptores del nivel Pro en Estados Unidos. Próximamente, planea llevarlo a usuarios de Plus, Team y Enterprise, así como integrar sus capacidades en ChatGPT.

Últimas Noticias

La Comisión Europea ve contradicciones entre los nuevos aranceles de Trump y el acuerdo comercial UE-EEUU

Exige Bruselas a Washington transparencia tras la imposición de nuevos impuestos al comercio por la administración Trump, mientras la incertidumbre jurídica y el malestar en el Parlamento Europeo ponen en duda la viabilidad del reciente acuerdo transatlántico

La Comisión Europea ve contradicciones

El Amiab Albacete conquista la Copa del Rey de baloncesto en silla de ruedas

La escuadra manchega logró revertir la tradición ante el conjunto madrileño en un duelo intenso, protagonizado por Oscar Onrubia y Jorge Salazar, quienes guiaron a sus compañeros a una segunda consagración histórica en el torneo nacional

El Amiab Albacete conquista la

Ortega Cano y su hermana, impactados por la sorpresa de Gloria Camila en su 30 cumpleaños: "Espectacular"

La hija del diestro sorprendió a todos durante la celebración de su aniversario con una coreografía inesperada junto al bailarín Abel Gil, emocionando a familiares y amigos en una noche llena de recuerdos y momentos únicos

Ortega Cano y su hermana,

Una mujer palestina muerta por disparos israelíes en la Franja de Gaza a pesar del alto el fuego

Fuentes médicas y locales destacaron que Basma Aram Banat, de 27 años, perdió la vida luego de recibir un tiro en Beit Lahiya pese a la tregua, mientras continúan ataques aéreos y operaciones militares en áreas civiles de Gaza

Una mujer palestina muerta por

El servicio de protección de Trump mata a tiros a un joven que intentó entrar en su residencia de Mar-a-Lago

Un joven de 20 años murió tras recibir disparos cuando intentaba acceder armado a una propiedad en Florida, según informó el Servicio Secreto, que confirmó la apertura de una investigación y la suspensión provisional de los agentes implicados

El servicio de protección de