Así funciona OmniXtend: la interconexión de memoria por Ethernet para acelerar el entrenamiento de inteligencia artificial

El sistema de ETRI une recursos distribuidos y permite a servidores y aceleradores acceder dinámicamente a un fondo común, lo que amplía la capacidad sin reemplazar equipos y reduce los costos de despliegue y operación en centros de datos

Guardar
Google icon
Cerebro digital luminoso en tonos azules y magenta sobre una plataforma brillante. Está en un cuarto oscuro flanqueado por filas de racks de servidores iluminados.
OmniXtend, la tecnología del ETRI, permite ampliar la memoria de IA en centros de datos usando Ethernet estándar para reducir costos (Imagen Ilustrativa Infobae)

El Instituto de Investigación en Electrónica y Telecomunicaciones (ETRI) de Corea del Sur desarrolló OmniXtend, una tecnología de memoria que busca superar el límite de capacidad de las GPU (unidades de procesamiento gráfico) y reducir la sobrecarga por movimiento de datos, dos de los principales obstáculos del entrenamiento de inteligencia artificial a gran escala, informó el portal especializado en tecnología TechXplore.

La propuesta apunta a una consecuencia concreta para la infraestructura de IA: ampliar memoria sin reemplazar servidores y convertir recursos distribuidos en un único fondo compartido para cargas de trabajo cada vez más exigentes.

PUBLICIDAD

En las pruebas, el sistema mostró que, cuando la memoria disponible era insuficiente, el rendimiento de inferencia de un modelo de lenguaje grande se deterioraba. Al ampliar la memoria mediante Ethernet —la tecnología de red cableada de bajo costo ya desplegada masivamente en centros de datos de todo el mundo—, ese rendimiento se recuperó en más del doble, hasta niveles similares a los de un entorno convencional con memoria suficiente.

El avance llega en un momento en que la demanda de modelos de IA de gran escala y de computación de alto rendimiento crece con rapidez, mientras el volumen de datos a procesar aumenta de forma exponencial, señaló el portal especializado.

PUBLICIDAD

En ese escenario persiste el problema conocido como “muro de memoria”: aunque mejore la capacidad de cálculo de las GPU, la eficiencia disminuye notablemente cuando la memoria disponible no acompaña ese salto.

Infografía muestra un cerebro luminoso en un centro de datos, ilustrando la tecnología OmniXtend para expandir memoria en IA
Esta infografía detalla a OmniXtend, la tecnología surcoreana que expande la memoria de IA vía Ethernet, duplicando el rendimiento sin necesidad de renovar infraestructura de servidores. (Imagen Ilustrativa Infobae)

Cómo OmniXtend unifica la memoria

La arquitectura presentada por ETRI usa Ethernet estándar como tejido de interconexión de memoria, lo que permite compartir memoria entre servidores y aceleradores y tratar recursos distribuidos como un gran “pool” unificado. En la práctica, eso desacopla recursos que antes estaban ligados de forma local al hardware y habilita una asignación dinámica y escalable para tareas de IA.

Según el portal, esta tendencia cobra cada vez más relevancia a medida que los modelos de inteligencia artificial crecen en tamaño y demandan mayores capacidades de memoria.

En ese escenario, la arquitectura de memoria compartida, concebida como un gran fondo común de recursos, empieza a perfilarse como una de las tecnologías clave para sostener la próxima generación de infraestructura destinada a la IA.

OmniXtend logró demostrar una arquitectura de memoria compartida escalable basada en ese protocolo, diseñada para combinar alto rendimiento, capacidad de expansión y eficiencia de costos en el entrenamiento de inteligencia artificial a escala hiperescalar.

Al reducir la latencia en el movimiento de datos, esta tecnología permite acelerar los procesos de entrenamiento y ampliar la memoria disponible sin necesidad de reemplazar servidores, una ventaja que podría disminuir significativamente los costos de despliegue y operación en los centros de datos.

El contraste con las arquitecturas convencionales es uno de los puntos centrales del desarrollo. Los sistemas basados en interfaces seriales de alta velocidad como PCIe enfrentan límites en distancia de conectividad entre dispositivos y en escalabilidad del sistema, mientras que la nueva tecnología aprovecha switches (equipos de red que interconectan dispositivos) convencionales para agrupar múltiples dispositivos físicamente distribuidos en un único fondo de memoria.

Ilustración de un centro de datos con racks de servidores y GPUs a los lados, un switch central y un cubo transparente con RAM, unidos por cables y líneas luminosas.
La arquitectura basada en Ethernet utiliza switches convencionales para unificar dispositivos distribuidos en un solo pool de memoria para IA y big data (Imagen Ilustrativa Infobae)

Pruebas con modelos de lenguaje grande

Para construir el sistema, los investigadores desarrollaron un nodo de expansión de memoria basado en FPGA (chips programables de hardware) y un motor de transferencia de memoria sobre Ethernet, y verificaron el funcionamiento estable del conjunto.

En una demostración práctica, varios dispositivos conectados por ese protocolo formaron un fondo de memoria compartida y accedieron a la memoria de otros equipos en tiempo real.

La validación también incluyó una carga computacional con un modelo de lenguaje grande, con el fin de comprobar si la arquitectura aportaba mejoras en un entorno real de entrenamiento de IA. El resultado fue la recuperación del rendimiento en escenarios con memoria insuficiente, una condición que suele convertirse en cuello de botella en sistemas de gran escala.

La tecnología fue presentada en RISC-V Summit Europe 2025, realizado en París en mayo de 2025, y también en RISC-V Summit North America 2025, en Santa Clara, en Estados Unidos. De acuerdo con el portal, esa presentación atrajo atención sobre una propuesta orientada a infraestructura de IA y big data.

Ilustración abstracta de un cubo translúcido con módulos RAM y circuitos, rodeado por una intrincada red de nodos digitales luminosos y líneas de datos.
OmniXtend supera los límites de conectividad y escalabilidad de arquitecturas convencionales como PCIe, integrando dispositivos distribuidos en un solo fondo de memoria (Imagen Ilustrativa Infobae)

Próximos pasos y aplicaciones previstas

Además del desarrollo técnico, ETRI encabeza el Interconnect Working Group dentro de CHIPS Alliance de la Linux Foundation, donde trabaja en estándares abiertos para redes de IA y expansión de memoria. Esa participación forma parte de la estrategia para favorecer la adopción internacional del sistema.

El instituto prevé impulsar la comercialización de la tecnología mediante su transferencia a compañías de hardware y software para centros de datos. Entre sus posibles aplicaciones figuran servidores para entrenamiento e inferencia de IA, dispositivos de expansión de memoria y switches de red, dentro del mercado de infraestructura de nueva generación.

El organismo proyecta ampliar la investigación hacia interconexiones de memoria de gran capacidad para sistemas embebidos de alta fiabilidad, como los de automóviles y barcos, y extender la arquitectura de memoria compartida a aceleradores heterogéneos como NPU (unidades de procesamiento neuronal), GPU y CPU.

Kim Kang Ho, vicepresidente adjunto de la división de investigación en computación del futuro de ETRI, afirmó: “Planeamos ampliar de manera sustancial la investigación sobre tecnologías de interconexión de memoria centradas en unidades de procesamiento neuronal y aceleradores a través de nuevas iniciativas de proyectos”.

“Seguiremos avanzando en la tecnología y reforzando la colaboración internacional para asegurar su adopción en sistemas de próxima generación de empresas globales de IA y semiconductores”, cerró Ho.

PUBLICIDAD

PUBLICIDAD