
Intel y el Instituto de Ciencias Weizmann han presentado un avance en la decodificación especulativa, un nuevo método de gestión de algoritmos de inteligencia artificial (IA) que permite multiplicar por 2,8 la inferencia de los grandes modelos de lenguaje (LLM).
La decodificación especulativa es una técnica de optimización de inferencias diseñada para que los modelos de aprendizaje profundo (LMR) sean más rápidos y eficientes a la hora de resolver solicitudes, sin comprometer la precisión.
Esta técnica funciona combinando un modelo pequeño y rápido que genera la respuesta, con uno más grande y preciso que la comprueba y valida. Sin embargo, puede ocasionar dificultades cuando se utiliza con distintos vocabularios.
En este marco, investigadores de Intel y del Instituto de Ciencias Weizmann han hallado un nuevo procedimiento con el que permiten aumentar en hasta 2,8 veces la velocidad de inferencia de los LLM, al facilitar la decodificación especulativa en modelos heterogéneos.
La tecnológica ha dado a conocer este avance en el marco de la Conferencia Internacional sobre Aprendizaje Automático (ICML), celebrada en Vancouver (Canadá), que permite que cualquier modelo pequeño "en borrador" acelere cualquier LLM, "independientemente de las diferencias de vocabulario".
Así, esta novedad soluciona una "ineficiencia fundamental en la IA generativa", tal y como ha detallado Intel en un comunicado, donde ha subrayado que, además, también funciona con modelos de diferentes desarrolladores y ecosistemas, y de código abierto, lo que lo hace una novedad "independiente del proveedor".
Concretamente, el nuevo método se basa en tres nuevos algoritmos, que "desacoplan la codificación especulativa de la alineación de vocabulario". De esta manera, se facilita la implementación flexible de LLM y permite combinar cualquier borrador de modelo pequeño con cualquier modelo grande para optimizar la velocidad y el coste de la inferencia .
"En un panorama fragmentado de IA, este avance en la decodificación especulativa promueve la apertura, la interoperabilidad y una implementación rentable desde la nube hasta el edge", ha sentenciado la tecnológica, al tiempo que ha matizado que desarrolladores, empresas e investigadores "ahora pueden combinar modelos para adaptarse a sus necesidades de rendimiento y a las limitaciones de hardware".
Con todo ello, Intel ha compartido que los algoritmos ya están disponibles en la biblioteca de código abierto de Hugging Face Transformers.
Últimas Noticias
Zegona nombra a Tim Pennington nuevo consejero independiente
Con una amplia carrera en finanzas corporativas y telecomunicaciones internacionales, el directivo británico asume responsabilidades clave en el Comité de Auditoría de la propietaria de Vodafone España mientras mantiene cargos relevantes en grandes empresas del sector

El Clan del Golfo anuncia que no intervendrá ni condicionará el voto en las elecciones de este domingo
A través de un comunicado, la principal organización criminal del país afirmó que no ejercerá presión sobre los comicios, instando a otras facciones armadas a respetar la libertad ciudadana, mientras el Gobierno y observadores internacionales mantienen reservas sobre su promesa

AMP. Rodrygo Goes se rompe el ligamento cruzado anterior y el menisco externo de la pierna derecha
El club blanco confirmó que el atacante brasileño estará fuera cerca de diez meses, quedando descartado para el resto del campeonato y la próxima cita mundialista tras recibir el último diagnóstico sobre la gravedad de su lesión de rodilla

South Summit Brazil 2026 refuerza su proyección internacional con más de 53 startups de 15 países
Un total de 53 empresas emergentes de 15 naciones fueron elegidas como finalistas de una competencia global de innovación, abarcando sectores digitales, salud, industria y sostenibilidad, con propuestas que atraen inversiones y promueven la transformación tecnológica

EEUU alerta de un "amenaza inminente" de ataques con misiles y drones en el este de Arabia Saudí
Washington solicita a sus ciudadanos resguardarse en Dhahran tras advertir un posible bombardeo, luego de que drones impactaran su Embajada en la capital saudí, hecho que provocó la evacuación del personal y el cierre del edificio consular
