Esta es la primera IA de Microsoft para competir con Anthropic y OpenAI en programación

Microsoft lanzó MAI-Code-1-Flash, su IA nativa para programación, incorporada en GitHub Copilot. (Reuters)

Microsoft ha anunciado oficialmente el lanzamiento de MAI-Code-1-Flash, su primer modelo de IA desarrollado desde cero y optimizado exclusivamente para la programación. Con este movimiento estratégico, el gigante de Redmond busca plantarle cara directamente a las soluciones compactas y especializadas de rivales de peso como Anthropic y OpenAI.

Ahora, este nuevo modelo se integra de forma nativa en GitHub Copilot y estará disponible para desarrolladores individuales a través de Visual Studio Code.

A diferencia de otros modelos del mercado, que suelen ser inteligencias artificiales generalistas adaptadas a posteriori para entender código, MAI-Code-1-Flash fue diseñado desde cero utilizando los flujos de trabajo de GitHub Copilot. Esto significa que el modelo ha sido entrenado de forma nativa para interactuar con los entornos, sistemas y herramientas reales que los programadores emplean a diario.

El nuevo modelo fue entrenado desde cero para mejorar la productividad de los desarrolladores en Visual Studio Code. (Imagen ilustrativa Infobae)

Según ha informado Microsoft, el entrenamiento se llevó a cabo utilizando datos completamente limpios y bajo licencias adecuadas, evaluando constantemente el rendimiento del modelo en tareas de ingeniería de software del mundo real, como la resolución de dudas sobre repositorios complejos, la refactorización de código y tareas automatizadas basadas en telemetría.

Control adaptativo de longitud: velocidad y ahorro de tokens

Una de las innovaciones más llamativas de MAI-Code-1-Flash es su sistema de control adaptativo de longitud de solución. En términos prácticos, el modelo es capaz de autorregular sus recursos: si el desarrollador le pide una tarea sencilla o directa, responderá de manera extremadamente concisa.

Sin embargo, si se enfrenta a un problema complejo que requiera alterar múltiples archivos o planificar una arquitectura, la IA invertirá mayor tiempo y recursos en razonar antes de emitir una respuesta más extendida.

Esta gestión inteligente permite a MAI-Code-1-Flash resolver desafíos de ingeniería complejos utilizando hasta un 60% menos de tokens en comparación con otros modelos del mercado, lo que se traduce de forma inmediata en una latencia drásticamente reducida y una experiencia de autocompletado en el editor mucho más fluida.

Este nuevo modelo se integra de forma nativa en GitHub Copilot. (Europa Press)

Las primeras comparativas

Para demostrar el músculo de su nueva herramienta, Microsoft ha comparado a MAI-Code-1-Flash cara a cara con Claude Haiku 4.5, el modelo ligero de Anthropic enfocado en rendimiento rápido. Las pruebas se realizaron en entornos de producción idénticos a los reales utilizando pruebas de referencia de la industria como SWE-Bench (Verified, Pro y Multilingual) y Terminal Bench 2.

Los resultados no dejan lugar a dudas: el modelo de Microsoft superó a Claude en todos los frentes. La brecha más destacable se dio en SWE-Bench Pro, donde MAI-Code-1-Flash obtuvo un 51,2% de efectividad frente al 35,2% de Anthropic.

Fuera del código puro, el modelo también sacó una ventaja de casi 29 puntos en seguimiento preciso de instrucciones (IF Bench), además de destacar en áreas como matemáticas y generación de código visual.

Las pruebas de Microsoft mostraron que el modelo supera a Claude Haiku 4.5 de Anthropic en efectividad y precisión. (Anthropic)

Para evitar que el modelo simplemente repitiese soluciones memorizadas, Microsoft lo sometió a un examen “trampa” de 186 preguntas con escenarios contradictorios, imposibles o con información faltante. MAI-Code-1-Flash logró un impresionante 85,8% de precisión ajustada, demostrando una gran capacidad de razonamiento lógico.

Esta es la primera IA de Microsoft para competir con Anthropic y OpenAI en programación

MAI-Code-1-Flash destaca por su control adaptativo de longitud, optimizando respuestas y eficiencia de recursos

Control adaptativo de longitud: velocidad y ahorro de tokens

Las primeras comparativas

Más Noticias

Cuál es el asistente de IA de Elon Musk para programar sin límites con código abierto

Grok Build ahora puede ejecutarse de forma local, sin depender de servidores externos de xAI

Cuál es el riesgo de usar el celular mientras se carga y está conectado a una toma

Hábitos como este resultan perjudiciales si no se siguen las recomendaciones de seguridad

Copa Mundial generó casi 214 millones de nuevos seguidores en Instagram: Messi, Vozinha y Haaland de capitanes

El torneo ha provocado un salto histórico en la popularidad digital de los futbolistas

WhatsApp superó los 29 millones de mensajes por segundo en el mundo gracias a Argentina

Los goles de Romero, Messi y Enzo Fernández dispararon el tráfico de la aplicación a un nivel nunca antes alcanzado

Cinco trucos con la IA para llenar la polla del Mundial de fútbol y otros torneos

Especialistas advierten que esta tecnología no reemplaza la intuición ni la experiencia de los fanáticos al emitir sus pronósticos

Control adaptativo de longitud: velocidad y ahorro de tokens

Las primeras comparativas

Temas Relacionados

Más Noticias

Cuál es el asistente de IA de Elon Musk para programar sin límites con código abierto

Grok Build ahora puede ejecutarse de forma local, sin depender de servidores externos de xAI

Cuál es el riesgo de usar el celular mientras se carga y está conectado a una toma

Hábitos como este resultan perjudiciales si no se siguen las recomendaciones de seguridad

Copa Mundial generó casi 214 millones de nuevos seguidores en Instagram: Messi, Vozinha y Haaland de capitanes

El torneo ha provocado un salto histórico en la popularidad digital de los futbolistas

WhatsApp superó los 29 millones de mensajes por segundo en el mundo gracias a Argentina

Los goles de Romero, Messi y Enzo Fernández dispararon el tráfico de la aplicación a un nivel nunca antes alcanzado

Cinco trucos con la IA para llenar la polla del Mundial de fútbol y otros torneos

Especialistas advierten que esta tecnología no reemplaza la intuición ni la experiencia de los fanáticos al emitir sus pronósticos