
Microsoft ha presentado un nuevo modelo de lenguaje pequeño, Phi-3 mini, diseñado para su ejecución en un 'smartphone' moderno y que ofrece un rendimiento similar a GPT-3.5 de OpenAI. La nueva iteración del modelo de lenguaje más ligero de Microsoft ha sido entrenado con 3,3 billones de tokens procedentes de conjuntos de datos "más grandes y más avanzados" que los utilizados en el modelo predecesor, Phi-2, que fue entrenado con 1,4 billones de tokens. Phi-3 mini se presenta con un tamaño de 3.800 millones parámetros, suficiente para su uso en un 'smartphone' moderno, ya que ocupa en torno a 1,8GB de memoria y se puede cuantificar a 4bits, como recogen en el texto publicado en Arxiv.org. Los investigadores han utilizado para las pruebas un iPhone 14 con un chip A16 Bionic en el que, aseguran, "se ejecuta de forma nativa y de forma completa offline logrando más de 12 tokens por segundo". El rendimiento general de este modelo "rivaliza" con el de otros más grandes, como es el caso de Mixtral 8x7B y GPT-3.5. La compañía tecnológica ha empleado una arquitectura de decodificador de transformador, que admite una longitud de texto de 4K, y al basarse en una estructura en bloque similar a la de Llama 2 de Meta, no solo "beneficia" a la comunidad de código abierto, sino que también admite todos los paquetes desarrollados para Llama 2. El modelo admite un formato conversacional, de chat, y está alineado con los valores de robustez y seguridad de Microsoft, como destacan en el texto de la investigación. Junto a Phi-3 mini, Microoft también ha entrenado dos modelos adicionales de la misma familia: Phi-3 medium, de 14.000 millones de parámetros, y Phi-3 small, con 7.000 millones de parámetros, ambos entrenados con 4.800 millones de tokens.
Últimas Noticias
Nissan recorta su producción en 1.200 unidades mensuales en Japón por el conflicto en Oriente Medio
La automotriz japonesa ajusta su ritmo en Kyushu tras la disminución de envíos a países árabes, consecuencia directa de la guerra entre Estados Unidos e Irán que obstaculiza rutas marítimas clave y complica la logística global del sector

Santiago Segura presenta 'Torrente, presidente' con una alfombra roja de lo más variada tras arrasar en cines
Celebridades del espectáculo español acudieron a la cita junto al equipo artístico, en una noche marcada por ovaciones, confesiones de su director y gestos de complicidad entre los invitados, destacando la presencia inesperada de figuras mediáticas y familiares emblemáticos

Israel critica a Reino Unido, Canadá, Francia, Alemania e Italia por "distorsionar" la situación en Líbano
El jefe de la diplomacia israelí acusó a gobiernos occidentales de omitir ataques de Hezbolá y presionar injustamente mientras la ofensiva deja cientos de víctimas, cuestionando si aceptarían una situación similar en sus propios territorios

Ecologistas pide reubicar las estaciones de calidad del aire orientadas al tráfico en los puntos críticos de cada ciudad
Solo algunas ubicaciones cumplen con la normativa europea, según un informe que urge a Madrid a establecer un plazo de un año para revisar los puntos de medición y garantizar análisis más precisos en las zonas urbanas más afectadas por la polución

Trib.Un afectado por el 'caso ataúdes': "Lo de menos es el féretro, lo grave es no saber si cenizas son de tu padre"
Familias comparecen en el juicio contra la funeraria El Salvador y relatan dolorosos testimonios sobre supuestas irregularidades en las incineraciones, denunciando engaños y el profundo impacto emocional de no tener certeza sobre la identidad de las cenizas entregadas
