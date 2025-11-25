Tecno

Anthropic afirma que su nueva IA Opus 4.5 supera a GPT-5

La última apuesta de la compañía introduce avances en precisión, modos de esfuerzo y precios, ampliando las opciones para desarrolladores y empresas

Opus 4.5 ha logrado un
Opus 4.5 ha logrado un 80,9% de precisión en una prueba clave para este tipo de modelos de IA. (Anthropic)

Anthropic ha anunciado Claude Opus 4.5, su modelo de inteligencia artificial más avanzado hasta la fecha, con la afirmación de que supera a los desarrollos más recientes de OpenAI, específicamente su modelo GPT-5.1 Codex-Max.

Según la compañía, Opus 4.5 se posiciona como la mejor opción mundial para programación, agentes inteligentes y aplicaciones informáticas, marcando un nuevo hito en la competencia global por el liderazgo en IA.

El lanzamiento de Opus 4.5 se produce pocos días después de la llegada de los modelos más recientes de sus principales rivales, así como de Grok 4.1, y refuerza la apuesta de Anthropic por el segmento profesional y de desarrolladores. De acuerdo con los datos de la empresa, el nuevo modelo ha alcanzado un 80,9% de precisión en SWE-Bench Verified, el principal benchmark para evaluar capacidades de ingeniería de software.

Asimismo, Opus 4.5 ha superado a todos los candidatos humanos en la exigente prueba de contratación para ingenieros de Anthropic, que impone un límite de dos horas para su resolución.

El modelo refuerza la apuesta
El modelo refuerza la apuesta de Anthropic por el sector profesional. (Anthropic)

Este desempeño ha consolidado a Anthropic como un referente en herramientas de IA para programación, hasta el punto de que Meta utiliza Claude en su asistente interno de código Devmate, a pesar de la competencia directa entre ambas compañías en otros ámbitos.

Más allá de la programación, Opus 4.5 introduce mejoras en la creación de documentos, hojas de cálculo y presentaciones profesionales, así como en tareas de investigación profunda que requieren el manejo de múltiples fuentes.

El modelo también destaca en razonamiento visual y matemático avanzado, y en la gestión de equipos de subagentes para sistemas multiagente complejos, ampliando su utilidad en entornos empresariales y de investigación.

En el plano de la eficiencia y los costes, Anthropic ha reducido de forma significativa el precio de su API, que pasa de $15/$75 por millón de tokens de entrada/salida a $5/$25. El modelo también muestra avances notables en el consumo de recursos: en modo de esfuerzo medio, iguala el rendimiento de Sonnet 4.5 con un 76% menos de tokens, y en modo alto, lo supera en 4,3 puntos porcentuales utilizando un 48% menos de tokens.

Opus 4.5 añade mejoras para
Opus 4.5 añade mejoras para la creación de documentos, hojas de cálculo, presentaciones y tareas de investigación avanzada. (Reuters)

La introducción de los modos de “esfuerzo” (bajo, medio, alto) permite a los desarrolladores ajustar el tiempo y los recursos que el modelo dedica a cada tarea, una tendencia que OpenAI también ha incorporado en sus últimos lanzamientos para optimizar la eficiencia sin sacrificar calidad.

Junto con el nuevo modelo, Anthropic ha actualizado su plataforma de desarrollo y sus aplicaciones para usuarios finales. Claude Code ahora mejora su modo de planificación, realizando preguntas aclaratorias antes de generar archivos editables con el plan de ejecución. Claude for Chrome se encuentra disponible para todos los usuarios Max, con precios que oscilan entre $100 y $200 mensuales según los límites de uso, y permite gestionar tareas en múltiples pestañas del navegador.

Por su parte, Claude for Excel se abre a usuarios Max, Team y Enterprise, ofreciendo soporte para gráficos, tablas dinámicas y carga de archivos. Además, la función de conversaciones infinitas elimina los límites de ventana de contexto en charlas largas, gracias a la implementación de resúmenes automáticos.

Con la actualización, Anthropic reorganiza
Con la actualización, Anthropic reorganiza su familia de modelos y amplía el acceso a funciones como Claude for Chrome y Excel para distintos usuarios. (Anthropic)

No obstante, el principal punto débil de Opus 4.5 y de la familia Claude sigue siendo el límite de uso. Incluso los suscriptores Pro y Max del primer nivel ven cómo sus tokens se agotan con rapidez y deben esperar cinco horas para que se reinicien desde el primer mensaje enviado.

El lanzamiento de Opus 4.5 también redefine la estructura de la familia de modelos de Anthropic. Durante los últimos dos meses, Sonnet 4.5 había superado al anterior Opus 4.1, lo que restaba atractivo al modelo más costoso. Ahora, con Haiku, Sonnet y Opus claramente diferenciados por coste, velocidad y capacidad, la compañía busca ofrecer soluciones adaptadas a distintas necesidades profesionales.

