Por qué la Inteligencia Artificial ‘piensa’ en inglés y qué consecuencias puede tener para la diversidad

Guardar

El predominio del inglés en los modelos de IA plantea graves preguntas sobre equidad y diversidad (Imagen Ilustrativa Infobae)

La inteligencia artificial (IA) se entrelaza cada vez más con nuestras vidas cotidianas, lo cual plantea una cuestión que despierta tanto curiosidad como preocupación: ¿por qué los modelos de lenguaje de gran tamaño (LLM), el cerebro de los chatbots, piensan en inglés incluso cuando interactúan en otros idiomas? Si bien tanto los términos cerebro y piensan son sólo analogías, permiten analizar por qué lo que podría parecer una peculiaridad técnica sin mayores consecuencias es, en realidad, algo realmente complicado. Esta característica de los LLM tiene implicaciones profundas, no solo en la eficiencia de la comunicación global digital sino también en la diversidad cultural y lingüística de nuestra sociedad global.

Cuando se plantean preguntas en chino, francés, alemán o ruso a estos modelos de lenguaje, parece que procesan las consultas en inglés, lo cual podría generar problemas culturales dada la prevalencia de conceptos más comunes en las culturas de habla inglesa. Este fenómeno se puso de manifiesto con el lanzamiento de ChatGPT, que marcó un punto de inflexión en la popularización de los LLM (y, para los hablantes de castellano, inundó el mundo de gerundios mal empleados). Una investigación reciente realizada por Chris Wendler, Veniamin Veselovsky y sus colegas del Instituto Federal Suizo de Tecnología, de Lausana, mostró cómo procesan las consultas los modelos Llama 2 de Meta. Al difundirla, New Scientist ofreció una visión fascinante del funcionamiento interno de estos sistemas y sus posibles sesgos.

Los modelos de lenguaje grande procesan idiomas no ingleses a través de un "subespacio inglés" (Imagen Ilustrativa Infobae)

Los científicos alimentaron a los modelos Llama 2 con tres tipos de instrucciones en chino, francés, alemán y ruso: una solicitaba repetir la palabra dada; otra pedía traducir de uno de esos idiomas a otro; y la tercera solicitaba completar un espacio en blanco en una oración. Al rastrear cómo los modelos procesaban cada instrucción, descubrieron que casi siempre la ruta de procesamiento a través de las capas pasaba por lo que denominaron el subespacio inglés. Esto indica fuertemente que el inglés es utilizado como un puente para ayudar a entender los conceptos: para que los LLM comprendan y procesen conceptos en varios idiomas, primero traducen estos conceptos al inglés, procesan la información, y luego traducen las respuestas de vuelta al idioma de origen.

El dominio del inglés en los modelos de IA plantea preguntas cruciales sobre la diversidad y la equidad. Carissa Véliz, de la Universidad de Oxford, y Aliya Bhatia, del Centro para la Democracia & Tecnología en Washington DC, comentaron a New Scientist cómo el anglocentrismo podría reducir la diversidad y superponer una vista limitada del mundo sobre regiones lingüística y culturalmente distintas. Esto no solo afecta a la precisión con que se generan respuestas en otros idiomas pero podría también llevar a resultados irrelevantes o incluso peligrosos en situaciones críticas.

Existen desafíos logísticos y financieros para crear un modelo de IA global y representativo (Imagen Ilustrativa Infobae)

Aunque tales modelos pueden ofrecer un rendimiento fuerte en tareas en varios idiomas, gracias al inglés como lengua pivote, el riesgo de sesgo es significativo. Veselovsky, uno de los investigadores, subrayó a New Scientist que la prevalencia de datos de alta calidad en inglés para entrenar a estos modelos es mayor que en la mayoría de otros idiomas, lo cual puede favorecer inadvertidamente los valores culturales anglocéntricos.

La implementación de un modelo LLM verdaderamente multilingüe plantea desafíos no solamente técnicos, sino también éticos y económicos. Aunque los modelos como Llama 2 de Meta han demostrado capacidad para procesar y responder preguntas en varios idiomas, estos todavía dependen predominantemente del inglés como un “lenguaje puente”.

Diseñar e implementar un modelo que opere de manera nativa en múltiples idiomas sin recurrir al inglés como intermediario implica superar varios obstáculos. Primero, requiere la compilación de un corpus de entrenamiento diverso y representativo que abarque una amplia gama de idiomas y dialectos. Esto, a su vez, conlleva a la necesidad de recabar y procesar enormes cantidades de datos en idiomas menos dominantes en el entorno digital, lo que representa un desafío logístico y financiero considerable.

Los investigadores suizos destacaron la importancia de desarrollar modelos de IA multilingües (Imagen Ilustrativa Infobae)

Además, la dependencia del inglés en los LLM refleja patrones de poder y privilegio en el mundo real. Combatir esta tendencia significa enfrentar y cuestionar estos patrones, pero sobre todo hacer un esfuerzo para lograr una representación equitativa de todas las culturas y lenguas.

La detección de un sesgo anglocéntrico en los LLM abre un campo de investigación crucial para el futuro de la inteligencia artificial: cómo garantizar que los avances tecnológicos beneficien equitativamente a todas las culturas y lenguas. Es esencial que las futuras versiones de modelos de lenguaje grande se desarrollen con una cobertura lingüística más equitativa para reflejar y respetar la rica diversidad del panorama lingüístico y cultural humano, destacaron los investigadores suizos.

Últimas Noticias

Las redes sociales y los adolescentes, un debate que se expande en el mundo: ¿prohibición total o uso limitado?

Mientras países como España avanzan con restricciones para menores de 16 años, especialistas advierten que prohibir no alcanza. Qué dicen los estudios, cuáles son los riesgos y qué estrategias proponen para acompañar a los jóvenes en el uso de las redes sociales

Por qué la Inteligencia Artificial ‘piensa’ en inglés y qué consecuencias puede tener para la diversidad

Una investigación reveló cómo los modelos de lenguaje procesan los idiomas diferentes del inglés, y desató un debate sobre el anglocentrismo y su impacto social y cultural

¿Cómo “piensan” los modelos en inglés?

¿Por qué es importante esta “anglocentración”?

¿Qué dicen los especialistas?

¿Es factible implementar un modelo multilingüe equitativo?

¿Hacia dónde nos dirigimos?

Últimas Noticias

Las redes sociales y los adolescentes, un debate que se expande en el mundo: ¿prohibición total o uso limitado?

Mientras países como España avanzan con restricciones para menores de 16 años, especialistas advierten que prohibir no alcanza. Qué dicen los estudios, cuáles son los riesgos y qué estrategias proponen para acompañar a los jóvenes en el uso de las redes sociales

Invertir en longevidad: cuáles son las empresas AgeTech que cuidan el mañana

Desde robots sociales hasta avances en biotecnología, surgen nuevas formas de prevención y acompañamiento para quienes atraviesan la tercera edad

Cómo conversar por WhatsApp con alguien que no tiene instalada la aplicación

Los Guest Chats permiten invitar a cualquier persona a un chat de WhatsApp mediante un enlace personalizado

¿Poner una llave sobre el router Wi-Fi realmente dirige la señal hacia zonas específicas de la casa?

Gemini, la inteligencia artificial de Google, aclara el trasfondo técnico y desmonta el mito con argumentos claros

Este es el nuevo juego de Steam con temática similar a Diablo y más de 1.000 críticas positivas

Dragonkin: The Banished, el nuevo RPG de acción de Eko Software, se consolida como una alternativa para los fans de este género

Las 4 obras que Boca Juniors tendrá listas después del Mundial 2026 para activar la construcción de la cuarta bandeja de La Bombonera

15 frases de Riquelme tras el sorteo de la Libertadores: los rivales de Boca, optimismo por llegar a la final y un mensaje al plantel

Los argentinos Alex Barrena y Lautaro Midón avanzaron con autoridad a los cuartos de final del Challenger de Asunción

Cinco argentinos salen a la cancha en el Masters 1000 de Miami: horarios y cruces de la jornada

Del abrazo entre Riquelme y Ramón Díaz al show de Ruggeri: las perlitas del sorteo de la Copa Libertadores

Drink The Sea, la banda integrada por figuras del rock internacional, debuta en Argentina: su amor por el asado y Soda Stereo

Quiénes son Los del Espacio, el grupo detrás del hit que desató la pelea entre María Becerra y Emilia Mernes

Ian Lucas, el ganador de MasterChef Celebrity, habló con Teleshow: “El premio no va a ser para mí”

Quiénes son los invitados de Mirtha Legrand y Juana Viale este fin de semana

Así abandonó Andrea del Boca la casa de Gran Hermano, en medio de dudas sobre su continuidad: “Gracias por este viaje”

INFOBAE AMÉRICA

El estrecho de Ormuz tiene una larga historia de perturbaciones

El sorprendente origen de la frutilla: científicos rastrean datos evolutivos y revelan su historia desconocida

Emiratos Árabes Unidos desmanteló una “red terrorista” financiada y operada por Hezbollah e Irán

Líderes de la UE exigieron a la Comisión medidas “sin demora” ante la suba de combustibles y electricidad por la guerra en Medio Oriente

Con luces y sombras, la película de Peaky Blinders se interna en el legado sobrenatural de su protagonista

¿Cómo “piensan” los modelos en inglés?

¿Por qué es importante esta “anglocentración”?

¿Qué dicen los especialistas?

¿Es factible implementar un modelo multilingüe equitativo?

¿Hacia dónde nos dirigimos?

Temas Relacionados

Últimas Noticias

Las redes sociales y los adolescentes, un debate que se expande en el mundo: ¿prohibición total o uso limitado?

Mientras países como España avanzan con restricciones para menores de 16 años, especialistas advierten que prohibir no alcanza. Qué dicen los estudios, cuáles son los riesgos y qué estrategias proponen para acompañar a los jóvenes en el uso de las redes sociales

Invertir en longevidad: cuáles son las empresas AgeTech que cuidan el mañana

Desde robots sociales hasta avances en biotecnología, surgen nuevas formas de prevención y acompañamiento para quienes atraviesan la tercera edad

Cómo conversar por WhatsApp con alguien que no tiene instalada la aplicación

Los Guest Chats permiten invitar a cualquier persona a un chat de WhatsApp mediante un enlace personalizado

¿Poner una llave sobre el router Wi-Fi realmente dirige la señal hacia zonas específicas de la casa?

Gemini, la inteligencia artificial de Google, aclara el trasfondo técnico y desmonta el mito con argumentos claros

Este es el nuevo juego de Steam con temática similar a Diablo y más de 1.000 críticas positivas

Dragonkin: The Banished, el nuevo RPG de acción de Eko Software, se consolida como una alternativa para los fans de este género

Las 4 obras que Boca Juniors tendrá listas después del Mundial 2026 para activar la construcción de la cuarta bandeja de La Bombonera

15 frases de Riquelme tras el sorteo de la Libertadores: los rivales de Boca, optimismo por llegar a la final y un mensaje al plantel

Los argentinos Alex Barrena y Lautaro Midón avanzaron con autoridad a los cuartos de final del Challenger de Asunción

Cinco argentinos salen a la cancha en el Masters 1000 de Miami: horarios y cruces de la jornada

Del abrazo entre Riquelme y Ramón Díaz al show de Ruggeri: las perlitas del sorteo de la Copa Libertadores

Drink The Sea, la banda integrada por figuras del rock internacional, debuta en Argentina: su amor por el asado y Soda Stereo

Quiénes son Los del Espacio, el grupo detrás del hit que desató la pelea entre María Becerra y Emilia Mernes

Ian Lucas, el ganador de MasterChef Celebrity, habló con Teleshow: “El premio no va a ser para mí”

Quiénes son los invitados de Mirtha Legrand y Juana Viale este fin de semana

Así abandonó Andrea del Boca la casa de Gran Hermano, en medio de dudas sobre su continuidad: “Gracias por este viaje”

INFOBAE AMÉRICA

El estrecho de Ormuz tiene una larga historia de perturbaciones

El sorprendente origen de la frutilla: científicos rastrean datos evolutivos y revelan su historia desconocida

Emiratos Árabes Unidos desmanteló una “red terrorista” financiada y operada por Hezbollah e Irán

Líderes de la UE exigieron a la Comisión medidas “sin demora” ante la suba de combustibles y electricidad por la guerra en Medio Oriente

Con luces y sombras, la película de Peaky Blinders se interna en el legado sobrenatural de su protagonista