
Microsoft ha anunciado dos nuevos modelos de lenguaje pequeños (SLM, por sus siglas en inglés) de la familia Phi, Phi-4-multimodal y Phi-4-mini, que están diseñados para brindar a los desarrolladores capacidades de Inteligencia Artificial (IA) avanzadas en tareas de procesamiento de voz, texto e imágenes.
La compañía ha comentado en su blog que estos modelos son "ideales para escenarios extremos y entornos con limitaciones de cómputo" y ya se están utilizando para explorar diferentes casos de uso en diversas industrias, incluida la detección de anomalías en la fabricación o la mejora de las experiencias de los clientes en el comercio minorista.
Phi-4-multimodal es un modelo de 5.600 millones de parámetros, que integra procesamiento de voz, imágenes y texto en una única arquitectura unificada. Debido a que aprovecha técnicas avanzadas de aprendizaje intermodal, permite interacciones "más naturales y sensibles al contexto", según ha explicado Microsoft.
Este modelo puede procesar tanto imágenes como audio a la vez, así como gráficos, tablas y documentos, superando a modelos especializados como WhisperV3 y SeamlessM4T-v2-Large, en las tareas de reconocimiento automático de voz y traducción. Además, ofrece una inferencia de baja latencia y alta eficiencia mientras se optimiza la ejecución en el dispositivo y se reduce la sobrecarga computacional.
Microsoft también ha señalado que Phi-4-multimodal "se encuentra entre los pocos modelos abiertos que implementan con éxito el resumen de voz" y alcanzan niveles de rendimiento de GPT-4o. No obstante, presenta una brecha con otros modelos como Gemini-2.0-Flash en tareas de respuesta a preguntas, por lo que está trabajando para mejorar esta capacidad en las próximas iteraciones.
Phi-4-mini, por su parte, es un modelo de 3.800 millones de parámetros, con una capacidad de responder a consultas agrupadas, un vocabulario de 200.000 palabras y "está diseñado para la velocidad y la eficiencia". En este sentido, la marcha ha indicado que, a pesar de que tiene un tamaño compacto, sigue superando a los modelos más grandes en tares basadas en texto, incluido el razonamiento, las matemáticas, el seguimiento de instrucciones y la codificación.
Este modelo admite secuencias de hasta 128.000 tokens y brinda alta precisión y escalabilidad para que los desarrolladores puedan adaptarlo en aplicaciones de IA avanzadas. Además, se puede integrar en interfaces de programación estructuradas.
Microsoft ha señalado finalmente que tanto Phi-4-multimodal como y Phi-4-mini ya están disponibles en Azure AI Foundry, Hugging Face y Nvidia API Catalog, con una experiencia multimodal completa.
Últimas Noticias
Un ensayo clínico demuestra la eficacia de una terapia dirigida contra un tumor ultra raro
Investigadores del Vall d’Hebron Instituto de Oncología reportan que un medicamento innovador logró una reducción tumoral significativa y mejoras funcionales en una patología poco común y debilitante, resultados que impulsan su evaluación por organismos regulatorios internacionales

Más de 724.000 mujeres migrantes obtuvieron la nacionalidad por residencia entre 2015 y 2024, según Migraciones
Cerca del 48% de las residentes documentadas en España a septiembre de 2025 son mujeres extranjeras, mientras que la mayoría proviene de la Unión Europea y América Latina, según el último informe del Observatorio Permanente de la Inmigración

UNAD destaca la necesidad de alcanzar un consenso político amplio para aprobar la ley de alcohol y menores
La organización insiste en aprobar una legislación actualizada para proteger a menores frente al consumo de bebidas alcohólicas, advierte sobre los riesgos de reforzar castigos en delitos leves reincidentes y reivindica más prevención y apoyo al Tercer Sector
Google Cloud ha destacado a Metrovacesa como caso de éxito por MiA, su asistente de IA que atiende consultas 24/7

La próxima consola de Xbox tiene nombre en clave 'Project Helix' y reproducirá juegos de PC
Asha Sharma, nueva CEO de Microsoft Gaming, anticipa que el próximo hardware de Xbox será referente por su potencia y permitirá el acceso a títulos de ambas plataformas, diferenciándose de la estrategia exclusiva anunciada recientemente por PlayStation
