Google resolvió el problema que más cuesta en la IA y casi nadie lo notó

Guardar

El nuevo algoritmo TurboQuant de Google Research comprime el caché de inteligencia artificial hasta seis veces sin pérdida de calidad REUTERS/Arnd Wiegmann/Archivo

La mayoría asume que el problema costoso de la inteligencia artificial es entrenarla. Meses de cómputo, miles de GPUs, cientos de millones de dólares. Eso es verdad. Pero hay otro costo, más silencioso y más cotidiano, que pocos ven: mantenerla funcionando.

Cada vez que interactúas con ChatGPT, Gemini o Claude, el modelo necesita recordar todo lo que dijiste en la conversación. Esa memoria de trabajo se llama KV cache, y crece con cada mensaje. En conversaciones largas o documentos extensos, ese espacio se vuelve enorme. Ejecutar un modelo grande para 512 usuarios al mismo tiempo puede consumir hasta 512 gigabytes de memoria solo en el caché. Casi cuatro veces lo que necesita el modelo en sí.

Eso se traduce en hardware, electricidad y un límite muy concreto sobre cuánto puede durar una conversación antes de que el sistema colapse o se vuelva prohibitivamente caro.

Lo que Google acaba de cambiar

El almacenamiento de memoria temporal, conocido como KV cache, consume hasta cuatro veces más recursos que el propio modelo de IA en conversaciones prolongadas (Imagen Ilustrativa Infobae)

El 24 de marzo, Google Research publicó TurboQuant: un algoritmo que comprime ese caché hasta seis veces sin perder calidad. El resultado fue presentado en ICLR 2026, la conferencia más importante de aprendizaje automático del año.

Lo notable no es solo el nivel de compresión. Es que funciona sin reentrenar el modelo, sin calibrarlo, sin datos específicos. Se aplica directamente encima de lo que ya existe. Y en los benchmarks estándar —comprensión de textos, generación de código, resumen— el modelo comprimido obtuvo resultados idénticos al modelo original.

Los investigadores usan la expresión ‘neutralidad absoluta de calidad’. No aproximada. Idéntica.

El algoritmo también demostró hasta ocho veces más velocidad en el cálculo de atención sobre GPUs H100, el hardware más avanzado disponible hoy. Ese número aplica al componente específico de atención, no a la inferencia completa, pero sigue siendo una diferencia operativa significativa.

Por qué importa más allá de lo técnico

El algoritmo de Google acelera hasta ocho veces el cálculo de atención sobre GPUs H100, optimizando el uso del hardware más avanzado (Imagen Ilustrativa Infobae)

Si el caché ocupa seis veces menos memoria, el mismo hardware puede atender seis veces más usuarios, sostener conversaciones seis veces más largas o correr modelos más grandes en dispositivos con menos recursos. Las tres opciones son reales, con distinto balance según el caso.

Google no publicó código oficial. Aun así, en pocos días de anunciado el paper, desarrolladores independientes replicaron los resultados desde cero. Uno probó el sistema en una GPU de consumo doméstico y obtuvo respuestas idénticas bit a bit al modelo sin comprimir. Eso no pasa seguido. Significa que el paper dice lo que dice.

Hay una carrera silenciosa para abaratar el costo de operar la IA. No de construirla. De usarla todos los días. Esa carrera no tiene portadas ni presentaciones con aplausos, pero es la que va a determinar qué empresas pueden escalar sus modelos y cuáles van a descubrir que el límite no es lo que saben hacer, sino cuánto cuesta seguir haciéndolo.

La IA más inteligente del mundo no sirve de nada si no podés pagarla.

Google resolvió el problema que más cuesta en la IA y casi nadie lo notó

El cuello de botella no es la inteligencia. Es la factura. La técnica desarrollada reduce drásticamente el uso de recursos en cada interacción con sistemas avanzados, transforma la economía de los asistentes digitales y amplía el acceso a la tecnología

Lo que Google acaba de cambiar

Por qué importa más allá de lo técnico

Últimas Noticias

YouTube en Argentina: la lista de los 10 videos más reproducidos que son tendencia hoy

Nuevos artistas y canciones han entrado en el top de los clips más vistos en la plataforma de videos más famosa del mundo

Uno de cada 10 jóvenes de la Generación Z lo tiene claro: los jefes deben ser reemplazados por la IA

El 69% de los encuestados ya trata a la IA con cortesía, anticipando un posible rol de liderazgo digital en el futuro

¿Cuáles son las nuevas tendencias en YouTube en Colombia?

Tal es la popularidad de la plataforma de YouTube que se trata del segundo sitio más buscado sólo detrás del propio Google

No es el currículum: Elon Musk revela qué es más importante para él al contratar nuevo personal

Musk reconoce que contratar solo por reputación o experiencia previa no garantiza el éxito en sus compañías

Lista de los artistas más reproducidos hoy en YouTube Chile

Tal es la popularidad de la plataforma de YouTube que se trata del segundo sitio más buscado sólo detrás del propio Google

DEPORTES

El particular caso de Giovani Lo Celso: debutó en un Mundial tras sus fallidas experiencias y marcó un gran gol de tiro libre para Argentina

Argentina-Jordania, EN VIVO, por el Mundial 2026: Lo Celso y Lautaro Martínez le dan la victoria al campeón del mundo

¿Cábala o casualidad?: el detalle en la indumentaria de la selección argentina contra Jordania que causó furor por el recuerdo de Qatar

La lupa sobre el milimétrico offside que le impidió a Colombia lograr un triunfo histórico sobre Portugal en el final del partido

Con un gol sobre la hora del hijo de Diego Milito, Racing eliminó a Independiente en el clásico de Reserva y avanzó a semifinales

TELESHOW

Los números de Ekaterina Ojeda: cómo impactó en sus redes sociales el escándalo con Mauro Icardi y la China Suárez

Los famosos vivieron a pleno la previa del partido de La Scaloneta entre maquillajes, banderazos y looks argentinos

El desgarrador posteo de Benicio, el hijo de Ernestina Pais: “Yo era tu todo y, aunque me costaba admitirlo, vos el mío”

Mirtha Legrand impactó con un vestido aguamarina y dejó un guiño para la Selección Argentina: “Celeste, por el partido”

Lali Espósito suma otro hito en su carrera y será una de las figuras del Madrid Orgullo 2026 tras su año récord

INFOBAE AMÉRICA

Dos incendios de autobús el mismo sábado en El Salvador dejan a un motociclista fallecido

Honduras: Aeropuerto Toncontín no puede operar vuelos internacionales por contrato de Palmerola, afirma la Secretaría de Infraestructura y Transporte

El régimen de Irán atacó a Kuwait y Bahréin con misiles tras los bombardeos de EEUU a 10 objetivos militares iraníes

Hallan culpables en Panamá a los dos acusados por el asesinato de turista española

Más de 500 denuncias exponen crisis en cárceles hondureñas por hacinamiento, falta de salud y presuntos abusos

Lo que Google acaba de cambiar

Por qué importa más allá de lo técnico

Temas Relacionados

Últimas Noticias

YouTube en Argentina: la lista de los 10 videos más reproducidos que son tendencia hoy

Nuevos artistas y canciones han entrado en el top de los clips más vistos en la plataforma de videos más famosa del mundo

Uno de cada 10 jóvenes de la Generación Z lo tiene claro: los jefes deben ser reemplazados por la IA

El 69% de los encuestados ya trata a la IA con cortesía, anticipando un posible rol de liderazgo digital en el futuro

¿Cuáles son las nuevas tendencias en YouTube en Colombia?

Tal es la popularidad de la plataforma de YouTube que se trata del segundo sitio más buscado sólo detrás del propio Google

No es el currículum: Elon Musk revela qué es más importante para él al contratar nuevo personal

Musk reconoce que contratar solo por reputación o experiencia previa no garantiza el éxito en sus compañías

Lista de los artistas más reproducidos hoy en YouTube Chile

Tal es la popularidad de la plataforma de YouTube que se trata del segundo sitio más buscado sólo detrás del propio Google

DEPORTES

El particular caso de Giovani Lo Celso: debutó en un Mundial tras sus fallidas experiencias y marcó un gran gol de tiro libre para Argentina

Argentina-Jordania, EN VIVO, por el Mundial 2026: Lo Celso y Lautaro Martínez le dan la victoria al campeón del mundo

¿Cábala o casualidad?: el detalle en la indumentaria de la selección argentina contra Jordania que causó furor por el recuerdo de Qatar

La lupa sobre el milimétrico offside que le impidió a Colombia lograr un triunfo histórico sobre Portugal en el final del partido

Con un gol sobre la hora del hijo de Diego Milito, Racing eliminó a Independiente en el clásico de Reserva y avanzó a semifinales

TELESHOW

Los números de Ekaterina Ojeda: cómo impactó en sus redes sociales el escándalo con Mauro Icardi y la China Suárez

Los famosos vivieron a pleno la previa del partido de La Scaloneta entre maquillajes, banderazos y looks argentinos

El desgarrador posteo de Benicio, el hijo de Ernestina Pais: “Yo era tu todo y, aunque me costaba admitirlo, vos el mío”

Mirtha Legrand impactó con un vestido aguamarina y dejó un guiño para la Selección Argentina: “Celeste, por el partido”

Lali Espósito suma otro hito en su carrera y será una de las figuras del Madrid Orgullo 2026 tras su año récord

INFOBAE AMÉRICA

Dos incendios de autobús el mismo sábado en El Salvador dejan a un motociclista fallecido

Honduras: Aeropuerto Toncontín no puede operar vuelos internacionales por contrato de Palmerola, afirma la Secretaría de Infraestructura y Transporte

El régimen de Irán atacó a Kuwait y Bahréin con misiles tras los bombardeos de EEUU a 10 objetivos militares iraníes

Hallan culpables en Panamá a los dos acusados por el asesinato de turista española

Más de 500 denuncias exponen crisis en cárceles hondureñas por hacinamiento, falta de salud y presuntos abusos