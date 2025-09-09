Tecno

Latam-GPT: el modelo de IA open-source que habla tu idioma sin problema

El proyecto prevé la creación de modelos derivados para salud, educación y agricultura, así como futuras capacidades de análisis multimodal, abriendo nuevas posibilidades a comunidades, empresas y entidades públicas latinoamericanas

Santiago Neira

Por Santiago Neira

En Latinoamérica buscan avanzar en la soberanía tecnológica con el desarrollo de Latam-GPT, una inteligencia artificial de código abierto entrenada con datos y enfoques propios de América Latina y el Caribe.

El proyecto, coordinado por el Centro Nacional de Inteligencia Artificial (CENIA) en Chile, articula esfuerzos de más de treinta organizaciones académicas y tecnológicas de la región y constituye una de las apuestas más ambiciosas en el campo de la IA de código abierto en el sur global.

Qué es el modelo de inteligencia artificial de Latinoamérica

Desde sus inicios, la iniciativa ha adoptado el principio de colaboración panregional como eje central. Toda la base de conocimiento de Latam-GPT descansa en un extenso corpus de información recolectada directamente de 20 países latinoamericanos, además de insumos de España.

Esta base de datos, que alcanza los ocho terabytes de texto y supera los 2,6 millones de documentos, aspira a reflejar con precisión el panorama lingüístico y cultural del área. Los responsables asignaron prioridad a que los datos no solo sean abundantes, sino representativos.

Brasil aporta más de 680.000 documentos, seguido de México, España, Colombia y Argentina, una elección que responde tanto al tamaño poblacional como al grado de digitalización de cada país.

El modelo, actualmente en fase de entrenamiento avanzado, cuenta con 50.000 millones de parámetros, cifra que lo ubica en la misma categoría tecnológica que los principales sistemas comerciales internacionales, pero con el matiz de estar especialmente adaptado a la región.

Latam-GPT no pretende replicar los grandes modelos desarrollados en Estados Unidos o China, sino responder a la pregunta de cómo la IA puede ser verdaderamente útil en contextos donde la realidad y los desafíos suelen ser diferentes.

El equipo técnico se ha concentrado en reducir los sesgos, garantizar una mayor inclusión lingüística y aumentar la profundidad temática en cuestiones claves para los usuarios latinoamericanos. El corpus de entrenamiento reúne fuentes políticas, científicas, culturales y periodísticas de la región, cubriendo desde debates sobre salud pública hasta expresiones del arte popular y manifestaciones sociales.

Una de las novedades consiste en la incorporación inicial de información relevante sobre culturas originarias y la futura integración de lenguas indígenas. Grupos de trabajo ya desarrollan traductores automáticos para idiomas como mapuche, rapanui o guaraní, un avance inédito en el ecosistema local de IA.

Cuál es la tecnología de la IA latinoamericana y cuándo se podrá utilizar

En el plano técnico, Latam-GPT aprovecha la infraestructura de la Universidad de Tarapacá en Arica, que estableció un centro de supercomputación con una inversión de 10 millones de dólares y un clúster de 12 nodos equipados con GPUs Nvidia H200. Esta capacidad permite que el entrenamiento del modelo no dependa de servidores fuera de la región y favorece una infraestructura descentralizada y eficiente energéticamente.

El lanzamiento de la primera versión de Latam-GPT está programado para el presente año. Los desarrolladores esperan que la plataforma no solo ofrezca buen desempeño en tareas generales, sino que logre resultados superiores en temas específicos relacionados con la historia, la sociedad y las necesidades latinoamericanas.

El director de CENIA, Álvaro Soto, resumió uno de los fundamentos estratégicos de la IA: “No buscamos competir con OpenAI ni Google, sino construir una IA que entienda nuestros retos y refleje nuestra pluralidad”, comentó en una entrevista con WIRED.

El modelo está diseñado para ser reutilizable y adaptable por comunidades educativas, entidades públicas y sectores productivos de la región. Entre las principales metas se encuentra habilitar modelos derivados para campos específicos como la salud, la educación, la agricultura o la cultura, impulsando así aplicaciones prácticas donde la personalización y el contexto resultan decisivos para el impacto social.

El proyecto contempla también expandirse a modelos multimodales en futuras fases, integrando imagen y video para ampliar el rango de usos potenciales, además de la integración progresiva de nuevos colaboradores institucionales.

La construcción de Latam-GPT marca un punto de inflexión en el ecosistema de inteligencia artificial latinoamericano e impulsa el crecimiento de capacidades locales, desde la generación de talento hasta el desarrollo de infraestructura informática avanzada, en línea con los retos y las oportunidades propias de la región.

