OpenAI presenta su IA GPT-5.5 y la pone a prueba contra Claude en codificación: estos fueron los resultados

OpenAI realizó diversas pruebas internas para comparar a GPT-5.5 con modelos de IA de sus competidores. (Europa Press)

OpenAI ha dado a conocer GPT-5.5, su modelo de inteligencia artificial más avanzado hasta la fecha, con énfasis en la autonomía y la capacidad de ejecutar tareas complejas con mínima intervención humana.

El lanzamiento de GPT-5.5 responde a la necesidad de modelos que no solo sigan instrucciones detalladas, sino que puedan recibir tareas generales y completarlas gestionando la ambigüedad y los pasos intermedios. “GPT-5.5 entiende lo que el usuario busca y asume más trabajo por sí mismo”, indicó OpenAI.

Esta evolución refuerza la tendencia hacia asistentes digitales capaces de operar como agentes, desplazándose entre distintas tareas y herramientas de manera integrada.

En la prueba interna de OpenAI, el modelo logró 82,7% de precisión en Terminal-Bench 2.0, un récord en benchmarks de codificación. (Europa Press)

Resultados en pruebas internas

Uno de los avances más notables de GPT-5.5 se observa en el campo de la programación, según las pruebas de OpenAI. El modelo sobresale en flujos de trabajo complejos que requieren planificación y coordinación de herramientas, demostrando mejoras sustanciales sobre versiones previas.

En el benchmark Terminal-Bench 2.0, que mide el rendimiento de los agentes de IA, alcanzó una precisión del 82,7 %. En SWE-Bench Pro, logró un 58,6 % de éxito al resolver problemas reales de GitHub en un solo intento. En ambas pruebas, superó a sus predecesores y a competidores como Claude Opus 4.7, el modelo de Anthropic.

En tareas de ingeniería de mayor alcance, que pueden demandar hasta 20 horas a un desarrollador humano, GPT-5.5 mostró resultados superiores. Además de resolver cuestiones técnicas, el modelo es capaz de identificar puntos críticos en la arquitectura de sistemas y anticipar el impacto de cambios en el código, algo valorado por los expertos y los primeros usuarios.

La nueva IA destaca en la planificación, ejecución y revisión de flujos de trabajo de ingeniería. REUTERS/Bhawika Chhabra

OpenAI enfatiza que GPT-5.5 mantiene la misma latencia por token que su antecesor GPT-5.4, pese a su mayor inteligencia y autonomía. El modelo utiliza menos tokens para completar tareas similares, lo que se traduce en un menor costo computacional. “GPT-5.5 ofrece este salto de inteligencia sin comprometer la velocidad”, detalló la empresa, destacando que se ha conseguido una mayor capacidad de procesamiento y respuesta en entornos reales.

Expansión en el uso real y nuevos casos de aplicación

GPT-5.5 no solo mejora en codificación, sino que amplía su utilidad en tareas cotidianas de gestión de información, análisis de datos y generación de documentos y hojas de cálculo. El modelo puede interpretar interfaces, ejecutar acciones y transitar entre diferentes flujos de trabajo con gran fluidez. Ejemplos internos de OpenAI muestran su aplicación en departamentos de ingeniería, finanzas y comunicación.

En el área de comunicación, el modelo procesó datos de solicitudes de oradores durante seis meses, construyendo un marco de evaluación y automatizando aprobaciones de bajo riesgo. En finanzas, revisó más de 71.000 páginas de formularios fiscales K-1, excluyendo datos personales y reduciendo el tiempo de procesamiento en dos semanas. Además, la automatización de informes semanales en otra área logró ahorros de entre cinco y diez horas por semana.

Según OpenAI, GPT-5.5 mantiene la velocidad de GPT-5.4 pero utiliza menos recursos y tokens por tarea. EFE/ Etienne Laurent

Seguridad y despliegue gradual

OpenAI ha implementado sus salvaguardas más robustas hasta la fecha para el lanzamiento de GPT-5.5, incluyendo pruebas avanzadas, red-teaming y la colaboración de casi 200 socios de acceso temprano. El modelo ya está disponible para usuarios Plus, Pro, Business y Enterprise de ChatGPT y Codex, y se prevé el acceso por API tras cumplir requisitos adicionales de seguridad y escalabilidad.

La llegada de GPT-5.5 marca un nuevo paso en el desarrollo de infraestructura para IA agéntica, consolidando una inteligencia más autónoma, eficiente y lista para afrontar tareas complejas en entornos reales.

OpenAI presenta su IA GPT-5.5 y la pone a prueba contra Claude en codificación: estos fueron los resultados

El nuevo modelo está disponible para usuarios de ChatGPT Plus, Pro, Business y Enterprise

Resultados en pruebas internas

Expansión en el uso real y nuevos casos de aplicación

Seguridad y despliegue gradual

Más Noticias

Qué pasa con tu conexión a internet cuando aparece LTE en vez de 4G o 5G

Su velocidad de descarga puede variar según la cobertura y la infraestructura local

¿Una página web vacía? Los peligros de visitar estos sitios en internet

Sitios con mensajes de “Próximamente” pueden activar scripts ocultos al cargarse

YouTube en Argentina: los 10 videos que son populares hoy

Google compró YouTube en el 2006 por un valor de 1650 millones de dólares; en ese entonces se visualizaban 100 millones de videos al día

Lo mejor de YouTube Colombia: lista de los videos del momento

Tal es la popularidad de la plataforma de YouTube que se trata del segundo sitio más buscado sólo detrás del propio Google

Un malware oculto en Word puede engañar a la IA de Microsoft para alterar tus documentos en secreto

Copilot procesa estas órdenes sin notificar ni alertar sobre los cambios realizados

Resultados en pruebas internas

Expansión en el uso real y nuevos casos de aplicación

Seguridad y despliegue gradual

Temas Relacionados

Más Noticias

Qué pasa con tu conexión a internet cuando aparece LTE en vez de 4G o 5G

Su velocidad de descarga puede variar según la cobertura y la infraestructura local

¿Una página web vacía? Los peligros de visitar estos sitios en internet

Sitios con mensajes de “Próximamente” pueden activar scripts ocultos al cargarse

YouTube en Argentina: los 10 videos que son populares hoy

Google compró YouTube en el 2006 por un valor de 1650 millones de dólares; en ese entonces se visualizaban 100 millones de videos al día

Lo mejor de YouTube Colombia: lista de los videos del momento

Tal es la popularidad de la plataforma de YouTube que se trata del segundo sitio más buscado sólo detrás del propio Google

Un malware oculto en Word puede engañar a la IA de Microsoft para alterar tus documentos en secreto

Copilot procesa estas órdenes sin notificar ni alertar sobre los cambios realizados