
Anthropic ha comenzado a probar una nueva función de 'Soñar' en Claude Managed Agents, que permite que el modelo revise sesiones anteriores para encontrar patrones y errores a mejorar y, con ello, ayudar a los agentes a mejorar por sí mismos de cara a futuras tareas.
Claude Managed Agents es una plataforma que permite crear y desplegar agentes de inteligencia artificial (IA) autónomos basados en Claude directamente en la infraestructura en la nube de Anthropic, de cara a facilitar llevar a cabo tareas con sesiones de larga duración sin necesidad de gestionar servidores.
PUBLICIDAD
Anthropic pretende hacer que los agentes de esta plataforma sean más eficientes y funcionen mejor de forma conjunta aprendiendo de sus propios errores, para lo que ha implementado una nueva función de 'Soñar' en Claude Managed Agents.
La función de 'Soñar' se ha lanzado como vista previa para investigación y, como ha explicado la compañía en un comunicado, se basa en un proceso por el que Claude puede revisar las sesiones de tareas anteriores de los agentes, extrayendo patrones y organizando los recuerdos para que los agentes "mejoren con el tiempo" por sí mismos.
PUBLICIDAD
Es decir, Claude revive las tareas anteriores mediante un método de "simulación de sueños" con el que revela patrones que "un solo agente no puede percibir" cuando está ejecutando una tarea. Con ello, identifica errores frecuentes, flujos de trabajo en los que convergen los agentes y preferencias compartidas.
En base a todo lo identificado, reestructura la memoria de los agentes incluyendo estas observaciones a medida que evolucionan en las siguientes tareas, lo que se traduce en mejores resultados para labores de larga duración y la orquestación multiagente.
PUBLICIDAD
"La memoria y los sueños, en conjunto, conforman un sólido sistema de memoria para agentes que se perfeccionan a sí mismos. La memoria permite que cada agente capture lo que aprende durante su trabajo", ha aclarado Anthropic.
Así, la función de 'soñar' puede actualizar la memoria de los agentes automáticamente, sin embargo, los usuarios pueden revisar los cambios sugeridos antes de que se apliquen en futuras sesiones.
PUBLICIDAD
'OUTCOMES' Y ORQUESTACIÓN MULITAGENTE
Más allá de la función e 'Soñar', Anthropic también ha implementado una característica de 'Outcomes' o resultados, que se basa en definir "una rúbrica que describe qué significa el éxito" en una tarea concreta, de manera que el agente encargado tenga en mente este objetivo y trabaje para conseguirlo.
PUBLICIDAD
Una vez completada la tarea, es evaluada de forma automática por un agente independiente que compara el resultado obtenido con los criterios establecidos en la rúbrica y, si no se cumplen, el agente vuelve a intentar el proceso de otra forma las veces que sea necesario hasta llegar al éxito.
Con ello, se trata de un proceso automático que garantiza resultados más confiables de los agentes sin que los usuarios tengan que estar revisando el proceso. Así, se trata de una opción útil para tareas que requieren atención al detalle y una cobertura exhaustiva, como ha apuntado la tecnológica.
PUBLICIDAD
Por otra parte, para aquellos casos en los que la carga de trabajo es excesiva para un solo agente, Anthropic ha lanzado la orquestación multiagente, que permite que un agente principal divida la tarea en distintas partes y delegue cada una a un especialista con su propio modelo.
Estos especialistas trabajan en paralelo en un sistema de archivos compartido y contribuyen al contexto general del agente principal, como ha explicado la compañía, además se puede rastrear cada paso de estos subagentes en la consola de Claude.
PUBLICIDAD
Tanto 'Outcomes' como la orquestación multiagente ya están disponibles en beta pública en la plataforma Managed Agents.