Google resolvió el problema que más cuesta en la IA y casi nadie lo notó

Guardar

El nuevo algoritmo TurboQuant de Google Research comprime el caché de inteligencia artificial hasta seis veces sin pérdida de calidad REUTERS/Arnd Wiegmann/Archivo

La mayoría asume que el problema costoso de la inteligencia artificial es entrenarla. Meses de cómputo, miles de GPUs, cientos de millones de dólares. Eso es verdad. Pero hay otro costo, más silencioso y más cotidiano, que pocos ven: mantenerla funcionando.

Cada vez que interactúas con ChatGPT, Gemini o Claude, el modelo necesita recordar todo lo que dijiste en la conversación. Esa memoria de trabajo se llama KV cache, y crece con cada mensaje. En conversaciones largas o documentos extensos, ese espacio se vuelve enorme. Ejecutar un modelo grande para 512 usuarios al mismo tiempo puede consumir hasta 512 gigabytes de memoria solo en el caché. Casi cuatro veces lo que necesita el modelo en sí.

Eso se traduce en hardware, electricidad y un límite muy concreto sobre cuánto puede durar una conversación antes de que el sistema colapse o se vuelva prohibitivamente caro.

Lo que Google acaba de cambiar

El almacenamiento de memoria temporal, conocido como KV cache, consume hasta cuatro veces más recursos que el propio modelo de IA en conversaciones prolongadas (Imagen Ilustrativa Infobae)

El 24 de marzo, Google Research publicó TurboQuant: un algoritmo que comprime ese caché hasta seis veces sin perder calidad. El resultado fue presentado en ICLR 2026, la conferencia más importante de aprendizaje automático del año.

Lo notable no es solo el nivel de compresión. Es que funciona sin reentrenar el modelo, sin calibrarlo, sin datos específicos. Se aplica directamente encima de lo que ya existe. Y en los benchmarks estándar —comprensión de textos, generación de código, resumen— el modelo comprimido obtuvo resultados idénticos al modelo original.

Los investigadores usan la expresión ‘neutralidad absoluta de calidad’. No aproximada. Idéntica.

El algoritmo también demostró hasta ocho veces más velocidad en el cálculo de atención sobre GPUs H100, el hardware más avanzado disponible hoy. Ese número aplica al componente específico de atención, no a la inferencia completa, pero sigue siendo una diferencia operativa significativa.

Por qué importa más allá de lo técnico

El algoritmo de Google acelera hasta ocho veces el cálculo de atención sobre GPUs H100, optimizando el uso del hardware más avanzado (Imagen Ilustrativa Infobae)

Si el caché ocupa seis veces menos memoria, el mismo hardware puede atender seis veces más usuarios, sostener conversaciones seis veces más largas o correr modelos más grandes en dispositivos con menos recursos. Las tres opciones son reales, con distinto balance según el caso.

Google no publicó código oficial. Aun así, en pocos días de anunciado el paper, desarrolladores independientes replicaron los resultados desde cero. Uno probó el sistema en una GPU de consumo doméstico y obtuvo respuestas idénticas bit a bit al modelo sin comprimir. Eso no pasa seguido. Significa que el paper dice lo que dice.

Hay una carrera silenciosa para abaratar el costo de operar la IA. No de construirla. De usarla todos los días. Esa carrera no tiene portadas ni presentaciones con aplausos, pero es la que va a determinar qué empresas pueden escalar sus modelos y cuáles van a descubrir que el límite no es lo que saben hacer, sino cuánto cuesta seguir haciéndolo.

La IA más inteligente del mundo no sirve de nada si no podés pagarla.

Últimas Noticias

iOS 26.4 estrena modo antirrobo activado por automáticamente en el iPhone

Con la función activa, operaciones cruciales como cerrar la sesión de iCloud solo pueden realizarse si el usuario es identificado mediante Face ID

Android Auto cambia por completo la experiencia musical a bordo de cualquier vehículo y gratis

Uno de los principales focos de esta actualización está en las aplicaciones multimedia, especialmente en YouTube Music

Almacena más datos usando menos espacio y con este truco holográfico: cómo funciona

La tecnología permite aumentar la cantidad de datos almacenados en un solo material respecto a los discos duros tradicionales

Wikipedia le pone límites a la inteligencia artificial: lo que lees puede que no sea real

La enciclopedia en línea estableció nuevas reglas para limitar el uso de inteligencia artificial en la edición y redacción de artículos

Jennie, el perro robótico que redefine el cuidado médico: qué beneficios terapéuticos aporta en personas mayores

Una compañía de EE. UU. apostó por la integración de rasgos humanos y tecnología de vanguardia para facilitar el apego emocional en hospitales y residencias

Google resolvió el problema que más cuesta en la IA y casi nadie lo notó

El cuello de botella no es la inteligencia. Es la factura. La técnica desarrollada reduce drásticamente el uso de recursos en cada interacción con sistemas avanzados, transforma la economía de los asistentes digitales y amplía el acceso a la tecnología

Lo que Google acaba de cambiar

Por qué importa más allá de lo técnico

Últimas Noticias

iOS 26.4 estrena modo antirrobo activado por automáticamente en el iPhone

Con la función activa, operaciones cruciales como cerrar la sesión de iCloud solo pueden realizarse si el usuario es identificado mediante Face ID

Android Auto cambia por completo la experiencia musical a bordo de cualquier vehículo y gratis

Uno de los principales focos de esta actualización está en las aplicaciones multimedia, especialmente en YouTube Music

Almacena más datos usando menos espacio y con este truco holográfico: cómo funciona

La tecnología permite aumentar la cantidad de datos almacenados en un solo material respecto a los discos duros tradicionales

Wikipedia le pone límites a la inteligencia artificial: lo que lees puede que no sea real

La enciclopedia en línea estableció nuevas reglas para limitar el uso de inteligencia artificial en la edición y redacción de artículos

Jennie, el perro robótico que redefine el cuidado médico: qué beneficios terapéuticos aporta en personas mayores

Una compañía de EE. UU. apostó por la integración de rasgos humanos y tecnología de vanguardia para facilitar el apego emocional en hospitales y residencias

Radiografía de Mauritania, el humilde rival de la selección argentina: su racha negativa y sus principales figuras

Preocupación por Colapinto: los inconvenientes físicos y técnicos en su primera práctica en el Gran Premio de Japón de Fórmula 1

Quiénes serán los finalistas del Mundial 2026, según los lectores de Infobae

Fue compañero de Messi en el PSG, pasó por la selección de Francia y jugará para Mauritania el amistoso frente a la Argentina

La actividad de los argentinos en el Challenger Tour: triunfos de Román Burruchaga, Alex Barrena y Juan Pablo Ficovich

Marta Fort posó en Miami con un jugado look: cadenas y un corset negro con transparencias

El reclamo escatológico de Andrea del Boca en Gran Hermano a Del Moro en vivo: “Encontré el inodoro lleno”

Thiago Medina sorprendió a su hermana Camilota en vivo y contó la dieta que siguió para recuperarse del accidente

Desopilante momento en Gran Hermano: Brian Sarmiento salió desnudo del baño para atender el teléfono

Antonela Roccuzzo volvió a mostrar su fanatismo por Harry Potter y reaccionó al último tráiler de la nueva serie

INFOBAE AMÉRICA

Retiraron el busto de Evo Morales del antiguo Palacio Legislativo de Bolivia para evitar el “culto a la personalidad”

Crisis en Cuba: la CIDH denunció un deterioro “significativo” de servicios esenciales en la isla

La Justicia italiana aprobó la extradición de la ex diputada brasileña Carla Zambelli, aliada de Bolsonaro y condenada

Putin le pidió a los oligarcas rusos que contribuyan al presupuesto ante el fuerte aumento del costo de la guerra en Ucrania

Los líderes de línea dura de Irán toman el control: quiénes son los funcionarios que asumieron en plena guerra

Lo que Google acaba de cambiar

Por qué importa más allá de lo técnico

Temas Relacionados

Últimas Noticias

iOS 26.4 estrena modo antirrobo activado por automáticamente en el iPhone

Con la función activa, operaciones cruciales como cerrar la sesión de iCloud solo pueden realizarse si el usuario es identificado mediante Face ID

Android Auto cambia por completo la experiencia musical a bordo de cualquier vehículo y gratis

Uno de los principales focos de esta actualización está en las aplicaciones multimedia, especialmente en YouTube Music

Almacena más datos usando menos espacio y con este truco holográfico: cómo funciona

La tecnología permite aumentar la cantidad de datos almacenados en un solo material respecto a los discos duros tradicionales

Wikipedia le pone límites a la inteligencia artificial: lo que lees puede que no sea real

La enciclopedia en línea estableció nuevas reglas para limitar el uso de inteligencia artificial en la edición y redacción de artículos

Jennie, el perro robótico que redefine el cuidado médico: qué beneficios terapéuticos aporta en personas mayores

Una compañía de EE. UU. apostó por la integración de rasgos humanos y tecnología de vanguardia para facilitar el apego emocional en hospitales y residencias

Radiografía de Mauritania, el humilde rival de la selección argentina: su racha negativa y sus principales figuras

Preocupación por Colapinto: los inconvenientes físicos y técnicos en su primera práctica en el Gran Premio de Japón de Fórmula 1

Quiénes serán los finalistas del Mundial 2026, según los lectores de Infobae

Fue compañero de Messi en el PSG, pasó por la selección de Francia y jugará para Mauritania el amistoso frente a la Argentina

La actividad de los argentinos en el Challenger Tour: triunfos de Román Burruchaga, Alex Barrena y Juan Pablo Ficovich

Marta Fort posó en Miami con un jugado look: cadenas y un corset negro con transparencias

El reclamo escatológico de Andrea del Boca en Gran Hermano a Del Moro en vivo: “Encontré el inodoro lleno”

Thiago Medina sorprendió a su hermana Camilota en vivo y contó la dieta que siguió para recuperarse del accidente

Desopilante momento en Gran Hermano: Brian Sarmiento salió desnudo del baño para atender el teléfono

Antonela Roccuzzo volvió a mostrar su fanatismo por Harry Potter y reaccionó al último tráiler de la nueva serie

INFOBAE AMÉRICA

Retiraron el busto de Evo Morales del antiguo Palacio Legislativo de Bolivia para evitar el “culto a la personalidad”

Crisis en Cuba: la CIDH denunció un deterioro “significativo” de servicios esenciales en la isla

La Justicia italiana aprobó la extradición de la ex diputada brasileña Carla Zambelli, aliada de Bolsonaro y condenada

Putin le pidió a los oligarcas rusos que contribuyan al presupuesto ante el fuerte aumento del costo de la guerra en Ucrania

Los líderes de línea dura de Irán toman el control: quiénes son los funcionarios que asumieron en plena guerra