OpenAI presenta su IA GPT-5.5 y la pone a prueba contra Claude en codificación: estos fueron los resultados

El nuevo modelo está disponible para usuarios de ChatGPT Plus, Pro, Business y Enterprise

Guardar
OpenAI realizó diversas pruebas internas para comparar a GPT-5.5 con modelos de IA de sus competidores. (Europa Press)
OpenAI realizó diversas pruebas internas para comparar a GPT-5.5 con modelos de IA de sus competidores. (Europa Press)

OpenAI ha dado a conocer GPT-5.5, su modelo de inteligencia artificial más avanzado hasta la fecha, con énfasis en la autonomía y la capacidad de ejecutar tareas complejas con mínima intervención humana.

El lanzamiento de GPT-5.5 responde a la necesidad de modelos que no solo sigan instrucciones detalladas, sino que puedan recibir tareas generales y completarlas gestionando la ambigüedad y los pasos intermedios. “GPT-5.5 entiende lo que el usuario busca y asume más trabajo por sí mismo”, indicó OpenAI.

Esta evolución refuerza la tendencia hacia asistentes digitales capaces de operar como agentes, desplazándose entre distintas tareas y herramientas de manera integrada.

En la prueba interna de OpenAI, el modelo logró 82,7% de precisión en Terminal-Bench 2.0, un récord en benchmarks de codificación. (Europa Press)
En la prueba interna de OpenAI, el modelo logró 82,7% de precisión en Terminal-Bench 2.0, un récord en benchmarks de codificación. (Europa Press)

Resultados en pruebas internas

Uno de los avances más notables de GPT-5.5 se observa en el campo de la programación, según las pruebas de OpenAI. El modelo sobresale en flujos de trabajo complejos que requieren planificación y coordinación de herramientas, demostrando mejoras sustanciales sobre versiones previas.

En el benchmark Terminal-Bench 2.0, que mide el rendimiento de los agentes de IA, alcanzó una precisión del 82,7 %. En SWE-Bench Pro, logró un 58,6 % de éxito al resolver problemas reales de GitHub en un solo intento. En ambas pruebas, superó a sus predecesores y a competidores como Claude Opus 4.7, el modelo de Anthropic.

En tareas de ingeniería de mayor alcance, que pueden demandar hasta 20 horas a un desarrollador humano, GPT-5.5 mostró resultados superiores. Además de resolver cuestiones técnicas, el modelo es capaz de identificar puntos críticos en la arquitectura de sistemas y anticipar el impacto de cambios en el código, algo valorado por los expertos y los primeros usuarios.

La nueva IA destaca en la planificación, ejecución y revisión de flujos de trabajo de ingeniería. REUTERS/Bhawika Chhabra
La nueva IA destaca en la planificación, ejecución y revisión de flujos de trabajo de ingeniería. REUTERS/Bhawika Chhabra

OpenAI enfatiza que GPT-5.5 mantiene la misma latencia por token que su antecesor GPT-5.4, pese a su mayor inteligencia y autonomía. El modelo utiliza menos tokens para completar tareas similares, lo que se traduce en un menor costo computacional. “GPT-5.5 ofrece este salto de inteligencia sin comprometer la velocidad”, detalló la empresa, destacando que se ha conseguido una mayor capacidad de procesamiento y respuesta en entornos reales.

Expansión en el uso real y nuevos casos de aplicación

GPT-5.5 no solo mejora en codificación, sino que amplía su utilidad en tareas cotidianas de gestión de información, análisis de datos y generación de documentos y hojas de cálculo. El modelo puede interpretar interfaces, ejecutar acciones y transitar entre diferentes flujos de trabajo con gran fluidez. Ejemplos internos de OpenAI muestran su aplicación en departamentos de ingeniería, finanzas y comunicación.

En el área de comunicación, el modelo procesó datos de solicitudes de oradores durante seis meses, construyendo un marco de evaluación y automatizando aprobaciones de bajo riesgo. En finanzas, revisó más de 71.000 páginas de formularios fiscales K-1, excluyendo datos personales y reduciendo el tiempo de procesamiento en dos semanas. Además, la automatización de informes semanales en otra área logró ahorros de entre cinco y diez horas por semana.

Según OpenAI, GPT-5.5 mantiene la velocidad de GPT-5.4 pero utiliza menos recursos y tokens por tarea. EFE/ Etienne Laurent
Según OpenAI, GPT-5.5 mantiene la velocidad de GPT-5.4 pero utiliza menos recursos y tokens por tarea. EFE/ Etienne Laurent

Seguridad y despliegue gradual

OpenAI ha implementado sus salvaguardas más robustas hasta la fecha para el lanzamiento de GPT-5.5, incluyendo pruebas avanzadas, red-teaming y la colaboración de casi 200 socios de acceso temprano. El modelo ya está disponible para usuarios Plus, Pro, Business y Enterprise de ChatGPT y Codex, y se prevé el acceso por API tras cumplir requisitos adicionales de seguridad y escalabilidad.

La llegada de GPT-5.5 marca un nuevo paso en el desarrollo de infraestructura para IA agéntica, consolidando una inteligencia más autónoma, eficiente y lista para afrontar tareas complejas en entornos reales.