El modelo de código abierto de Xiaomi ofrece un rendimiento próximo a DeepSeek V3.2 thinking y Gemini 3 Pro

Guardar

La arquitectura Mixture of Experts (MoE) que implementa MiMo-V2-Flash emplea 309.000 millones de parámetros y, durante el procesamiento, activa selectivamente solo 15.000 millones. Esto distribuye la carga de cálculo entre expertos especializados en función de las tareas, lo que contribuye a reducir la demanda de recursos tanto computacionales como de memoria. Esta segmentación permite que el modelo ejecute tareas complejas sin requerir infraestructuras costosas. El modelo MiMo-V2-Flash fue presentado por Xiaomi como parte de una propuesta de código abierto que busca facilitar la automatización y la personalización de servicios digitales avanzados. Según consignó Europa Press, este desarrollo se orienta hacia la resolución de escenarios complejos en áreas de programación, razonamiento automatizado y procesos de negocio.

Uno de los aspectos destacados de MiMo-V2-Flash, reportó Europa Press, radica en la ventana de contexto que alcanza los 256.000 tokens. Esta característica habilita el mantenimiento de cientos de rondas de interacción entre agentes, así como la ejecución simultánea de numerosas llamadas a herramientas dentro de procesos automatizados. Esta capacidad refuerza la coherencia en operaciones prolongadas, como la generación de documentos de gran extensión o la automatización de flujos empresariales sostenidos a lo largo del tiempo. Durante su presentación, Xiaomi subrayó que este diseño permite alternar entre dos modos de respuesta: uno basado en la rapidez y otro en el razonamiento profundo. El medio Europa Press detalló que la posibilidad de elegir el modo según las exigencias del contexto favorece aplicaciones tanto en escenarios altamente técnicos como en sistemas de atención automática.

En el plano de la atención, Europa Press indicó que MiMo-V2-Flash combina mecanismos de atención global y una atención de ventana deslizante que abarca 128 tokens, con una proporción de 1:5. Cada token concentra su atención en una sección concreta de la entrada, minimizando de esa forma el uso de memoria y la computación exigida, lo que incide en una mayor eficiencia y escalabilidad para la integración en proyectos profesionales. El proceso de preentrenamiento, relató Europa Press, incluyó la utilización de 27 billones de tokens seleccionados de fuentes consideradas de calidad superior. Este proceso utilizó la predicción multi-token, lo que permite que el modelo anticipe varios tokens de manera paralela durante las fases de inferencia, sin aumentar los requisitos de memoria.

Xiaomi comunicó, según Europa Press, que MiMo-V2-Flash puede llevar a cabo inferencias a una velocidad de 150 tokens por segundo. El costo de operación también se posiciona como competencia clave, al fijar un precio de 0,1 dólares por cada millón de tokens de entrada y 0,3 dólares por cada millón de tokens generados en la salida, cifras que Europa Press calificó como por debajo de los niveles habituales en otras soluciones del sector. El modelo fue proyectado tanto para investigadores como para empresas que necesitan alternativas escalables, eficientes y económicamente accesibles frente a plataformas de inteligencia artificial privativas.

La publicación de MiMo-V2-Flash en plataformas como Hugging Face y Xiaomi MiMo API Open Platform, reportó Europa Press, facilita el acceso a los archivos de pesos y la documentación necesarios para su integración. Esta apertura permite que desarrolladores individuales y compañías personalicen el modelo para adaptarlo a diferentes entornos, desde la creación de páginas web HTML completamente funcionales hasta la automatización de operaciones empresariales más intrincadas. Europa Press añadió que Xiaomi sostiene como objetivo democratizar el acceso a sistemas de inteligencia artificial avanzados, reduciendo la barrera de entrada relacionada con costos y requisitos técnicos.

En los análisis técnicos presentados tanto por Xiaomi como por Europa Press, MiMo-V2-Flash sostiene rendimientos próximos a los obtenidos por sistemas como DeepSeek V3.2 thinking y Google Gemini 3 Pro, en áreas que abarcan lógica algorítmica y despliegue de agentes automatizados. Este rendimiento, unido a sus bajos costos y código abierto, lo posiciona como una alternativa particularmente valiosa para desarrolladores y empresas que prefieren evitar las restricciones y el coste inicial de las principales plataformas comerciales. La flexibilidad de alternar entre modos de respuesta rápida o razonada, amplía el abanico de aplicaciones potenciales y ajusta su uso a requerimientos empresariales específicos.

Europa Press subrayó la relevancia de la mezcla de arquitecturas de expertos, la atención híbrida y el sistema de predicción paralela, que consolidan a MiMo-V2-Flash como un exponente dentro del software de inteligencia artificial de código abierto. El modelo se ofrece acompañado de documentación técnica y soporte, aspectos que facilitan su integración en flujos de trabajo digitales y proyectos de automatización en empresas o instituciones dedicadas a la investigación.

A través de declaraciones reproducidas por Europa Press, Xiaomi destacó la importancia de un modelo que conserve eficiencia y escalabilidad, a la vez que se mantenga al alcance de una amplia diversidad de usuarios e investigadores. Los responsables del desarrollo enfatizaron que el diseño global persigue responder simultáneamente a las demandas de accesibilidad, bajo coste y personalización en la innovación tecnológica, manteniendo su uso abierto y colaborativo para fomentar el avance y la adaptación continua en el campo de la inteligencia artificial.

El modelo de código abierto de Xiaomi ofrece un rendimiento próximo a DeepSeek V3.2 thinking y Gemini 3 Pro

Diseñado para afrontar tareas complejas a gran escala, el sistema de Xiaomi promete eficiencia, flexibilidad y bajos costos para negocios e investigadores, facilitando personalización y uso profesional avanzado en proyectos de automatización o herramientas digitales con inteligencia artificial

Últimas Noticias

150.000 afganos vuelven a su país, la mayoría forzados, en primeras seis semanas del año

Ucrania confirma nuevas reuniones con Rusia y EE. UU. el 17 y 18 de febrero en Ginebra

Retrasan a marzo el testimonio del acusado de ordenar el asesinato de periodista eslovaco

Rutte cree que EE. UU. mantendrá fuerte presencia en la OTAN, convencional y nuclear

Coventry: "Respeto a Heraskevych por ser firme en sus convicciones, pero creo en las reglas"

Temas Relacionados