Los lenguajes complejos pueden ser más eficientes para la comunicación

Guardar

Los idiomas que son computacionalmente más difíciles de procesar compensan esta mayor complejidad con una mayor eficiencia: necesitan menos símbolos para codificar el mismo mensaje.

Es la conclusión de un estudio del Instituto Leibniz para la Lengua Alemana (IDS) que entrenó modelos computacionales del lenguaje en un vasto conjunto de datos que abarca miles de idiomas.

Los modelos lingüísticos son algoritmos informáticos que aprenden a procesar y generar lenguaje mediante el análisis de grandes cantidades de texto. Se destacan en la identificación de patrones sin depender de reglas predefinidas, lo que los convierte en herramientas valiosas para la investigación lingüística. Es importante destacar que no todos los modelos son iguales: sus arquitecturas internas varían, lo que determina cómo aprenden y procesan el lenguaje. Estas diferencias permiten a los investigadores comparar los idiomas de nuevas formas y descubrir conocimientos sobre la diversidad lingüística.

En su estudio, los investigadores entrenaron modelos lingüísticos con más de 6.500 documentos en más de 2.000 idiomas, que abarcan casi 3.000 millones de palabras. Los textos incluían escritos religiosos, documentos legales, subtítulos de películas, artículos de periódicos y mucho más.

Los investigadores calcularon la dificultad que tienen los modelos computacionales para procesar o producir texto, utilizándolo como medida de la complejidad del lenguaje. El trabajo se publica en la revista PLOS Complex Systems.

"Entrenamos modelos lingüísticos muy diferentes con este material textual", afirma el coautor Sascha Wolfer. "Algunos modelos simples solo tienen en cuenta las dos últimas palabras, lo que limita su capacidad para capturar patrones gramaticales a largas distancias. Otros, como los transformadores (similares a ChatGPT), utilizan mecanismos avanzados para analizar dependencias complejas y descubrir estructuras lingüísticas más ricas".

Sorprendentemente, los resultados fueron consistentes: a pesar de las importantes diferencias arquitectónicas, los modelos produjeron clasificaciones notablemente similares de complejidad del lenguaje.

"Si un idioma es más difícil de procesar que otro para un modelo de un corpus, esta relación se mantiene en otros modelos, tipos de texto e incluso si el modelo opera en un nivel simbólico diferente, por ejemplo, caracteres en lugar de palabras", explica el coautor Peter Meyer. "Estos hallazgos sugieren que los resultados no solo pueden reflejar un esfuerzo computacional, sino que también podrían ofrecer información sobre la complejidad intrínseca de los idiomas humanos".

TEXTOS MÁS CORTOS PARA TRANSMITIR EL MISMO CONTENIDO

¿Por qué, entonces, algunos idiomas evolucionarían para ser más complejos, dado el mayor esfuerzo requerido para el procesamiento? Un hallazgo clave del estudio puede proporcionar una respuesta: existe un equilibrio entre complejidad y eficiencia. Los idiomas con mayor complejidad tienden a producir textos más cortos para transmitir el mismo contenido, lo que refleja un mecanismo compensatorio donde una mayor complejidad estructural se compensa con una mayor eficiencia en la comunicación.

"Por lo tanto, tal vez el esfuerzo adicional requerido para aprender un idioma complejo tenga sus beneficios", sugiere Alexander Koplenig, autor principal del estudio.

"Una vez que se domina, un lenguaje complejo puede ofrecer más opciones para expresarse, lo que puede facilitar la transmisión de la misma idea utilizando menos símbolos. Esto es relevante, porque también demostramos que esta disyuntiva está determinada por los entornos sociales en los que se utilizan los idiomas, y las comunidades más grandes tienden a utilizar idiomas más complejos pero más eficientes".

Por lo tanto, se podría especular que en las sociedades grandes, la educación institucionalizada podría permitir una mayor complejidad lingüística al proporcionar un aprendizaje sistemático y formalizado del idioma, que apoya la adquisición y el uso de estructuras lingüísticas intrincadas. Al mismo tiempo, la importancia de la comunicación escrita en las sociedades más grandes puede crear presión para que los mensajes más breves reduzcan los costos de producción, almacenamiento y transmisión, como el papel para libros, el espacio de almacenamiento o el ancho de banda.

"Esta combinación (la educación que permite la complejidad y las necesidades prácticas que impulsan la eficiencia) podría explicar por qué los idiomas en las comunidades más grandes evolucionan de la manera en que lo hacen", continúa Koplenig. "Probar esta hipótesis especulativa es una dirección fascinante para la investigación futura".

Últimas Noticias

Delcy Rodríguez remodela la cúpula militar venezolana tras la destitución de Vladimir Padrino

Nuevos responsables castrenses fueron designados en Venezuela tras una sorpresiva reestructuración liderada por la presidenta encargada, quien reemplazó a antiguos mandos y elevó a figuras clave a puestos estratégicos en un momento de fuerte tensión política nacional

Delcy Rodríguez remodela la cúpula

El ministro de Hacienda brasileño Haddad deja el cargo para intentar su elección como gobernador de Sao Paulo

Tras un acto en Sao Bernardo do Campo, Fernando Haddad confirmó su salida de la administración federal y oficializó su postulación para la jefatura estatal, respaldado por Lula, quien valoró su diálogo con el Congreso y liderazgo en el Partido de los Trabajadores

El ministro de Hacienda brasileño

Detenido un quinto sospechoso del ataque contra la sinangoga de Róterdam

Un joven de 19 años fue arrestado en Tilburgo acusado de estar involucrado en la explosión dentro de un templo judío en Róterdam, mientras autoridades continúan investigando presuntos vínculos con recientes agresiones atribuidas a un grupo islamista

Detenido un quinto sospechoso del

EEUU confisca cuatro webs que atribuye a "operaciones psicológicas y represión transnacional" de Irán

Las autoridades estadounidenses revelan que los dominios intervenidos servían para diseminar desinformación y ataques informáticos promovidos por Teherán, según el Departamento de Justicia, que advierte sobre la amenaza de campañas digitales orientadas a intimidar opositores y periodistas

EEUU confisca cuatro webs que

México reclama una investigación "exhaustiva" por la muerte de un joven de 19 años bajo custodia del ICE

La Secretaría de Relaciones Exteriores urgió a Washington a esclarecer las circunstancias que provocaron el fallecimiento de Royer Pérez Jiménez en un centro de detención en Florida tras exigir responsabilidad y garantías para evitar otros decesos similares

México reclama una investigación "exhaustiva"