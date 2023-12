Tecnología desarrollada por Microsoft permite a sistemas de IA "olvidar" contenido de los libros de Harry Potter (Imagen Ilustrativa Infobae)

Más de dos décadas después de que J.K. Rowling presentara al mundo un universo de criaturas mágicas, bosques prohibidos y un mago adolescente, Harry Potter está encontrando una renovada relevancia en un cuerpo literario muy diferente: cada vez son más los investigadores que utilizan los best-sellers del mago para experimentar con la tecnología de la inteligencia artificial generativa, aludiendo a la perdurable influencia de la serie en la cultura popular y a la gran variedad de datos lingüísticos y complejos juegos de palabras que contienen sus páginas.

Una lista de estudios y trabajos académicos que hacen referencia a Harry Potter ofrece una instantánea de la investigación puntera en IA y de algunas de las cuestiones más espinosas a las que se enfrenta esta tecnología.

En el ejemplo reciente más notable, Harry, Hermione y Ron protagonizan un artículo titulado “¿Quién es Harry Potter?”, que arroja luz sobre una nueva técnica que ayuda a los grandes modelos lingüísticos a olvidar información de forma selectiva.

Es una tarea de alto riesgo para la industria: los grandes modelos lingüísticos, que alimentan los chatbots de IA, se basan en grandes cantidades de datos en línea, incluido material protegido por derechos de autor y otros contenidos problemáticos. Esto ha provocado demandas judiciales y el escrutinio público de algunas empresas de IA.

Los autores del artículo, los investigadores de Microsoft Mark Russinovich y Ronen Eldan, afirman que han demostrado que los modelos de IA pueden alterarse o editarse para eliminar cualquier conocimiento de la existencia de los libros de Harry Potter, incluidos personajes y argumentos, sin sacrificar la capacidad general de toma de decisiones y análisis del sistema de IA.

El dúo afirma que eligieron los libros por su familiaridad universal. “Creímos que sería más fácil para la gente de la comunidad investigadora evaluar el modelo resultante de nuestra técnica y confirmar por sí mismos que el contenido ha sido efectivamente ‘desaprendido’”, dijo Russinovich, director de tecnología de Microsoft Azure.

Casi todo el mundo puede plantear preguntas al modelo para comprobar si “conoce” o no los libros. Incluso las personas que no han leído los libros serían conscientes de los elementos de la trama y los personajes.

La obra de J.K. Rowling ayuda a crear modelos lingüísticos más precisos y menos problemáticos para las empresas de IA (HBO Max)

En otro estudio, investigadores de la Universidad de Washington en Seattle, la Universidad de California en Berkeley y el Allen Institute for AI desarrollaron un nuevo modelo lingüístico llamado Silo que puede eliminar datos para reducir riesgos legales. Sin embargo, el rendimiento del modelo disminuyó significativamente si se entrenaba solo con textos de bajo riesgo, como libros sin copyright o documentos gubernamentales, señalaron en un artículo publicado a principios de este año.

Para profundizar en el tema, los investigadores utilizaron los libros de Harry Potter para comprobar si cada fragmento de texto influye en el rendimiento de un sistema de inteligencia artificial. Crearon dos almacenes de datos, o colecciones de sitios web y documentos.

El primero incluía todos los libros publicados, excepto el primero de Harry Potter; el otro, todos los libros de la serie menos el segundo, y así sucesivamente. “Cuando se eliminan los libros de Harry Potter del almacén de datos, la perplejidad empeora”, afirman los investigadores, refiriéndose a la medida de la precisión de los modelos de IA.

Los estudios sobre IA llevan citando a Harry Potter desde hace al menos una década, pero se ha hecho más común a medida que académicos y tecnólogos se han centrado en herramientas de IA capaces de procesar y responder al lenguaje natural con respuestas pertinentes.

En el caso de Harry Potter, “la abundancia de escenas, diálogos y momentos emotivos lo hacen muy relevante para el área específica del procesamiento del lenguaje natural”, afirma Leila Wehbe, investigadora de Carnegie Mellon que en 2014 llevó a cabo una serie de experimentos en los que recopiló datos de resonancias magnéticas cerebrales de personas que leían historias de Harry Potter para comprender mejor los mecanismos del lenguaje.

En arXiv, un repositorio de acceso abierto de investigación científica, los artículos recientes incluyen: Machine learning for potion development at Hogwarts, Large Language Models Meet Harry Potter y Detecting Spells in Fantasy Literature with a Transformer Based Artificial Intelligence.

La serie literaria resulta ser una referencia común y significativa entre los investigadores más jóvenes de IA (Warner Bros. Pictures)

Incluso cuando no ocupa un lugar central en la investigación, Harry Potter es también una de las referencias literarias favoritas de los investigadores. Un estudio, por ejemplo, utilizó las obras de Rowling para poner a prueba la inteligencia de sistemas de IA como los que generó el chatbot ChatGPT, un tema que ha generado mucho revuelo en los últimos debates.

Terrence Sejnowski, director del laboratorio de neurobiología computacional del Instituto Salk de Estudios Biológicos, argumenta en el artículo que los chatbots no hacen más que reflejar la inteligencia y los prejuicios de sus usuarios, como el Espejo de Erised en el primer libro de Harry Potter, que refleja los deseos de una persona “Harry Potter es popular entre los investigadores más jóvenes”, afirma Wehbe.

“Los habrán leído de niños o adolescentes, por lo que pensarán en ellos a la hora de elegir un corpus de texto escrito o hablado”, dijo.

