Madrid, 14 mar (EFE).- Un observatorio de neologismos y variaciones del español y un verificador de textos ortográfico, gramatical y léxico en el que los usuarios podrán comprobar si lo que han escrito en español es correcto estarán a disposición libre de los usuarios a mediados de 2025 a través de la Real Academia Española (RAE).
Se trata de la segunda fase del proyecto LEIA (Lengua Española e Inteligencia Artificial) en el que está inmersa la RAE, tras la colaboración con las grandes empresas tecnológicas, y en la que también pondrá en marcha una herramienta de respuesta a dudas lingüísticas estarán a disposición libre de los usuarios a mediados de 2025.
"La RAE tiene que estar en el centro de la gran base de datos para alimentar a la Inteligencia Artificial" en español y hacer un corpus lingüístico cuidando de que no haya sesgos y que se use un lenguaje de calidad, ha indicado el director de la RAE y presidente de ASALE, que reúne a las academias de español en el mundo, Santiago Muñoz Machado.
Dotado con cinco millones de euros dentro del Plan de Recuperación, Transformación y Resiliencia mediante los fondos NextGenerationEU, la RAE ha pedido al Gobierno una ampliación del plazo para la finalización del proyecto LEIA, ya que se inició con más de un año de retraso por los trámites y autorizaciones necesarias, según han explicado Muñoz Machado y la académica a cargo del mismo, Asunción Gómez Pérez, por lo que calculan que estará finalizado a mediados de 2025.
Muñoz Machado ha indicado también que el anuncio que hizo en el Mobile World Congress el presidente del Gobierno, Pedro Sánchez, respecto al desarrollo de un gran modelo fundacional de lenguaje de inteligencia artificial entrenado de forma específica en español y en las lenguas cooficiales "como enunciado" le parece muy bien aunque ha indicado que no saben "mucho más del asunto".
Dentro de esta segunda fase del proyecto LEIA, la RAE trabaja en la creación de un observatorio de neologismos, términos y variaciones del español, que podrá detectar automáticamente, en el universo digital y a partir de un buen número de fuentes (obras académicas, corpus, prensa o redes sociales), palabras y expresiones que por distintos motivos no están registradas en el Diccionario de la lengua española (DLE) u otras obras académicas, así como nuevos usos de palabras.
Así, han explicado, los equipos lingüísticos de la RAE observarán diariamente palabras para decidir posteriormente si pasan o no a formar parte del diccionario.
También los usuarios podrán acceder libremente a esta herramienta de análisis a través de la página LEIA dentro de la web de la RAE (www.rae.es).
Además, los usuarios podrán introducir un texto para comprobar si es correcto desde un punto de vista ortográfico, gramatical y léxico. El verificador hará sugerencias de cambio para corregir el problema detectado y explicarán, basándose en las obras de la RAE, las razones de cambio.
Con este fin, el trabajo que lleva a cabo la RAE se complementará con encuentros (como hackathons) para poner a prueba el funcionamiento de la herramienta y fomentar su conocimiento entre el público especializado.
Una tercera herramienta dará respuesta a las dudas lingüísticas de los hispanohablantes mediante un buscador en el que se podrá introducir una cuestión y el sistema seleccionará la respuesta de entre los cientos de miles almacenadas en la plataforma. En caso de que el sistema aún no tenga una respuesta exacta para la pregunta, lo harán los lingüistas de la RAE.
También se recopilará material de las distintas variedades geográficas del español, especialmente léxico y oral, para lo que se creará una sección interactiva en la que los hispanohablantes puedan aportar información en relación con imágenes o textos. Con las grabaciones, se creará un corpus oral que permita entrenar a los sistemas o aplicaciones en los distintos acentos.
Además del personal de la RAE, el proyecto LEIA cuenta en esta fase con la participación de empresas externas subcontratadas, como es Fujitsu, con tecnología de Amazon Web Services (AWS), para el observatorio, el verificador, y los aspectos relacionados con la diversidad y accesibilidad, y VASS, para la elaboración de la herramienta de consultas y respuestas. EFE
cn/aam


