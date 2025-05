El modelo GPT-4.1 de OpenAI muestra avances notables en tareas de codificación, superando a versiones anteriores en benchmarks de la industria, con una ventana de contexto ampliada y mayor fiabilidad en el seguimiento de instrucciones REUTERS/Dado Ruvic/

OpenAI ha lanzado GPT-4.1 para todas las cuentas de pago de ChatGPT, accesible para usuarios de Plus, Pro o Team a través del menú desplegable de selección de modelos. Sin embargo, los usuarios gratuitos no tendrán acceso a esta actualización, aunque se espera que los usuarios de Enterprise y Edu lo obtengan en las próximas semanas.

El modelo GPT-4.1 mini, que se centra en la eficiencia y es más asequible, también se ha convertido en la opción predeterminada para todos los usuarios de ChatGPT, incluidos aquellos con cuentas gratuitas. Según detalló OpenAI, este modelo reemplaza al anterior GPT-4o mini en las opciones de selección de modelos para las cuentas de pago. Ambos modelos, GPT-4.1 y GPT-4.1 mini, están optimizados para tareas de codificación y seguimiento de instrucciones, superando a sus predecesores en todos los aspectos.

Una de las características destacadas de estos nuevos modelos es su capacidad para manejar una ventana de contexto de un millón de tokens, lo que representa una mejora significativa respecto al límite de 128.000 tokens de GPT-4o. Esta capacidad permite procesar una mayor cantidad de texto, imágenes o videos en una sola solicitud, lo que mejora su utilidad para tareas de codificación diarias. Además, OpenAI ha señalado que las mejoras en la velocidad hacen que GPT-4.1 sea más atractivo para estas tareas en comparación con los modelos de razonamiento OpenAI o3 y o4-mini introducidos en abril.

El rendimiento de GPT-4.1 ha sido evaluado en varios estándares de la industria. En el ámbito de la codificación, el modelo ha obtenido un 54,6% en el SWE-bench Verified, mejorando en un 21,4% respecto a GPT-4o y en un 26,6% respecto a GPT-4.5. En cuanto a la capacidad de seguir instrucciones, ha alcanzado un 38,3% en el benchmark MultiChallenge de Scale, lo que representa un aumento del 10,5% sobre GPT-4o. Además, en la comprensión de contextos largos, GPT-4.1 ha establecido un nuevo estándar con un 72,0% en la categoría de videos largos sin subtítulos, mejorando en un 6,7% respecto a GPT-4o.

OpenAI ha enfatizado que estos modelos han sido entrenados con un enfoque en la utilidad en el mundo real, gracias a la colaboración cercana con la comunidad de desarrolladores. Esto ha permitido optimizar los modelos para las tareas más relevantes en sus aplicaciones. La familia de modelos GPT-4.1 ofrece un rendimiento excepcional a un costo más bajo, avanzando en cada punto de la curva de latencia.

El modelo GPT-4.1 mini representa un avance significativo en el rendimiento de modelos pequeños, superando incluso a GPT-4o en muchos benchmarks. Este modelo iguala o supera a GPT-4o en evaluaciones de inteligencia, reduciendo la latencia casi a la mitad y el costo en un 83%. Para tareas que requieren baja latencia, GPT-4.1 nano es el modelo más rápido y económico disponible, con un rendimiento excepcional en una ventana de contexto de un millón de tokens.

Estas mejoras en la fiabilidad del seguimiento de instrucciones y la comprensión de contextos largos también hacen que los modelos GPT-4.1 sean considerablemente más efectivos para potenciar agentes o sistemas que pueden realizar tareas de manera independiente en nombre de los usuarios. Combinados con primitivas como la API de Respuestas, los desarrolladores pueden ahora construir agentes más útiles y confiables para la ingeniería de software en el mundo real, extrayendo información de documentos extensos y resolviendo solicitudes de clientes con mínima intervención.

En ChatGPT, muchas de las mejoras en el seguimiento de instrucciones, codificación e inteligencia se han incorporado gradualmente en la última versión de GPT-4o, y se seguirán incorporando más en futuras actualizaciones. Además, se comenzará a descontinuar la vista previa de GPT-4.5 en la API, ya que GPT-4.1 ofrece un rendimiento mejorado o similar en muchas capacidades clave a un costo y latencia mucho más bajos. La vista previa de GPT-4.5 se desactivará en tres meses, el 14 de julio de 2025, para permitir tiempo a los desarrolladores para la transición.

En el ámbito de la codificación, GPT-4.1 ha demostrado ser significativamente mejor que GPT-4o en una variedad de tareas, incluyendo la resolución autónoma de tareas de codificación, codificación frontend, y la realización de menos ediciones innecesarias.

GPT-4.1 también mejora sustancialmente en la codificación frontend, siendo capaz de crear aplicaciones web más funcionales y estéticamente agradables. En comparaciones directas, los evaluadores humanos pagados prefirieron los sitios web de GPT-4.1 sobre los de GPT-4o el 80% del tiempo.