Un grupo de científicos logró un avance inédito al entrenar un modelo de inteligencia artificial utilizando una computadora cuántica de IBM. Este desarrollo plantea preguntas clave sobre el futuro de la IA y el papel que la computación cuántica puede tener en su evolución.
El experimento demostró que es posible mejorar la capacidad de predicción y respuesta de un modelo de lenguaje avanzado sin necesidad de multiplicar su tamaño ni su consumo de recursos clásicos.
Qué significa entrenar una IA con una computadora cuántica
Hasta ahora, los grandes modelos de IA, como los que impulsan asistentes de texto o sistemas de chat, se entrenan exclusivamente en infraestructuras basadas en procesadores tradicionales, como CPUs o GPUs.
PUBLICIDAD
El proceso implica ajustar billones de parámetros para que el modelo aprenda a anticipar la siguiente palabra en una oración, una tarea fundamental para la comprensión y generación de lenguaje natural.
El estudio reciente, llevado a cabo por Multiverse Computing y ejecutado sobre el procesador cuántico IBM Quantum System Two, introduce una variación: en vez de escalar el modelo base añadiendo enormes bloques de memoria y potencia clásica, los investigadores incorporaron pequeños bloques cuánticos llamados adaptadores unitarios Cayley (CUA).
Estos bloques fueron insertados en una versión del modelo Llama 3.1 8B, que posee 8 mil millones de parámetros y fue desarrollado por Meta.
PUBLICIDAD
La principal diferencia con los métodos tradicionales es que la computadora cuántica no reemplaza toda la infraestructura, sino que complementa el modelo base con módulos especializados, capaces de mejorar la predicción con una cantidad ínfima de parámetros adicionales.
La importancia de este avance radica en que, por primera vez, se logró un “mejoramiento cuántico de punta a punta” en un modelo de lenguaje de escala real, usando hardware cuántico comercial.
¿Es más efectivo que una computadora tradicional?
El impacto de la integración cuántica se mide con un parámetro conocido como perplejidad. Esta métrica evalúa la capacidad del modelo para predecir la siguiente palabra correctamente: cuanto más baja es la perplejidad, mejor es la predicción del sistema.
PUBLICIDAD
En el experimento, el modelo híbrido logró reducir la perplejidad del Llama 3.1 8B en un 1,4 %, una mejora obtenida con solo 6.000 parámetros adicionales, equivalentes a apenas el 0,000075 % del total del modelo.
Para ponerlo en contexto, los grandes modelos de IA suelen crecer en precisión añadiendo millones de parámetros, lo que implica un consumo mucho mayor de memoria y energía. Aquí, la mejora se logra con un aumento casi insignificante en la complejidad del sistema.
A pesar de que la mejora numérica puede parecer modesta, el resultado es relevante: el modelo cuántico respondió correctamente preguntas que el modelo clásico no pudo resolver. Por ejemplo, en una prueba sobre astronomía, el modelo original respondió que solo Saturno tiene anillos, mientras que el modelo mejorado identificó correctamente que todos los planetas gigantes poseen anillos.
PUBLICIDAD
En otra pregunta de biología sobre genética de poblaciones, el modelo cuántico corrigió la respuesta a favor de la homogeneidad genética, donde el modelo base falló.
Estos resultados muestran que la integración de componentes cuánticos puede modificar el comportamiento de la IA en la dirección deseada. No implica todavía que las computadoras cuánticas sean capaces de reemplazar a las clásicas en todos los aspectos, pero sí que pueden aportar mejoras puntuales con un costo computacional mucho menor.
Qué implica este avance para el futuro de la IA
El experimento sirve como prueba de concepto: demuestra que los bloques cuánticos pueden incorporarse en modelos reales y producir mejoras medibles, aunque todavía no estamos ante una revolución inmediata. La computación cuántica aún enfrenta desafíos de hardware, como la necesidad de reducir el ruido y aumentar el número de cúbits útiles.
PUBLICIDAD
Sin embargo, el estudio abre la puerta a nuevas estrategias para mejorar modelos de IA sin depender únicamente de aumentar el tamaño y coste de la infraestructura clásica. Si en el futuro se logra desarrollar circuitos cuánticos más robustos y eficientes, es posible que modelos híbridos como el presentado puedan superar los límites actuales y alcanzar una “ventaja cuántica”, es decir, resolver tareas imposibles para cualquier computador tradicional.
De momento, la mayor lección es estratégica: las empresas y startups que trabajan en IA deben observar la evolución de la computación cuántica, integrándola como posibilidad para mejorar modelos sin multiplicar recursos. Por ahora, los procesadores clásicos siguen dominando, pero la frontera tecnológica empieza a moverse.