La inteligencia artificial se va a la biblioteca: Harvard presta sus libros más antiguos

Guardar

La universidad de Harvard y la Biblioteca Pública de Boston darán acceso a sus archivos más antiguos a empresas de IA. (Imagen Ilustrativa Infobae)

En un giro significativo hacia el pasado, los desarrolladores de inteligencia artificial (IA) están recurriendo a una fuente de conocimiento más antigua que internet: los libros almacenados en bibliotecas.

A medida que crecen las críticas por el uso no autorizado de obras con derechos de autor para entrenar modelos de lenguaje, instituciones como la Universidad de Harvard y la Biblioteca Pública de Boston han comenzado a compartir grandes colecciones de textos históricos y de dominio público con investigadores y empresas tecnológicas como OpenAI.

La apuesta es ambiciosa: digitalizar millones de páginas para aportar datos fiables y diversos al desarrollo de la IA.

Empresas desarrolladoras de inteligencia artificial podrán acceder a bibliotecas. (Imagen Ilustrativa Infobae)

Harvard ha lanzado recientemente “Institutional Books 1.0”, un conjunto de datos que incluye más de 394 millones de páginas escaneadas de libros que abarcan desde el siglo XV hasta el XIX y están escritos en 254 idiomas.

Esta colaboración ha sido posible gracias al apoyo económico de gigantes tecnológicos como Microsoft y OpenAI, que buscan fuentes de información menos polémicas y más ricas en contenido cultural y pedagógico. A su vez, estas iniciativas buscan empoderar a bibliotecas y museos, devolviéndoles parte del control sobre cómo se utiliza el conocimiento que resguardan.

Este cambio en el enfoque de entrenamiento para los sistemas de IA no solo representa una manera más ética de nutrir los modelos de lenguaje, sino también una oportunidad para democratizar el acceso a materiales que antes solo estaban disponibles en estanterías físicas.

Las bibliotecas ahora ayudarán con el desarrollo de chatbots. (Imagen Ilustrativa Infobae)

Sin embargo, también plantea nuevos desafíos sobre cómo manejar contenido desactualizado o potencialmente dañino que se encuentra en textos antiguos.

La colección de Harvard está compuesta por libros de literatura, filosofía, derecho, agricultura y ciencia, entre otros temas. Uno de sus volúmenes más antiguos es un manuscrito coreano del siglo XV sobre jardinería.

A diferencia de muchas de las fuentes utilizadas anteriormente (como redes sociales, Wikipedia o bases de datos pirateadas), este nuevo repositorio proviene de copias físicas auténticas, cuidadosamente conservadas por generaciones de bibliotecarios. Esta riqueza textual tiene un valor incalculable para empresas como OpenAI, que buscan mejorar la precisión y profundidad de sus sistemas sin incurrir en controversias legales.

La Biblioteca Pública de Boston, por su parte, ha sido clara con las condiciones de acceso a sus colecciones: todo material digitalizado debe estar disponible al público. Proyectos como la digitalización de periódicos en francés de Nueva Inglaterra del siglo XIX, que antes eran económicamente inviables, ahora pueden realizarse gracias al interés comercial de las tecnológicas.

Los chatbots de OpenAI serán entrenados con textos antiguos de bibliotecas públicas. (Imagen Ilustrativa Infobae)

De esta manera, las bibliotecas no solo conservan su misión educativa, sino que también fortalecen su papel en la evolución digital.

Aunque estas bibliotecas aportan una diversidad lingüística mayor a la de las fuentes tradicionales de IA —menos de la mitad de los textos están en inglés—, también traen consigo desafíos. Muchos textos contienen lenguaje y conceptos que hoy se consideran obsoletos o dañinos, como teorías científicas desacreditadas o discursos coloniales.

Por ello, el equipo de Harvard está elaborando guías para mitigar riesgos y fomentar un uso responsable de estos datos en sistemas de IA.

Además de representar un avance tecnológico, esta iniciativa también se perfila como un acto de justicia cultural: llevar conocimientos enterrados en archivos físicos al dominio público digital.

OpenAI tendrá acceso a archivos antiguos para entrenar a sus chatbots. (Imagen Ilustrativa Infobae)

El acceso a estos datos, a través de plataformas abiertas como Hugging Face, podría equilibrar el poder entre grandes corporaciones tecnológicas y comunidades académicas o locales que deseen desarrollar sus propias herramientas de inteligencia artificial. Así, el conocimiento histórico vuelve a ser un motor de innovación, esta vez en el corazón de la revolución digital.

De manuscritos antiguos a modelos de IA: el plan de Harvard y OpenAI para entrenar a los chatbots

La Universidad de Harvard digitalizó casi un millón de libros en 254 idiomas que ahora servirán para mejorar a los chatbots más populares del mundo

Tesoros bibliográficos al servicio de la IA

Retos éticos y oportunidades globales

Últimas Noticias

Argentina: lista de los 10 videos musicales que son tendencia en YouTube este día

La plataforma más popular de videos tiene presencia en 104 países y alrededor de cada minuto se suben a la plataforma 500 horas de contenido

YouTube en Colombia: la lista de los 10 videos más reproducidos que son tendencia hoy

Descubre quiénes son los artistas que han entrado al ranking con sus nuevos clips

El “padrino de la IA” afirma que las empresas solo se centran en los beneficios a corto plazo de esta tecnología

Geoffrey Hinton señala que la mayoría de las compañías tecnológicas solo buscan resultados rápidos con la inteligencia artificial

Ranking de tendencias en YouTube Chile: los 10 videos más reproducidos

La plataforma más popular de videos tiene presencia en 104 países y alrededor de cada minuto se suben a la plataforma 500 horas de contenido

Se acabaron los reinicios forzados: Microsoft permitirá pausar la actualizaciones en Windows indefinidamente

La nueva función llega tras múltiples problemas en actualizaciones recientes que afectaron la estabilidad y el arranque de miles de computadoras

La historia detrás del mito del colgante del Chino Maidana con el diente de Mayweather: el derechazo inolvidable que marcó la épica revancha

Jugó en la Selección y fue campeón con River Plate, aunque confiesa: “No lo disfruté como debía, me faltó patear el tablero”

Tras la victoria de Racing y la derrota de Independiente, así está la tabla del Torneo Apertura: el cronograma de la fecha 12

Racing le ganó 2-1 a Belgrano en Córdoba y se arrimó a la punta de su zona en el Torneo Apertura

Mariano Kestelboim, la reconversión que impulsa su carrera: título en Asunción y salto al top 100

Luke Cresswell, el creador de STOMP, antes de llegar a Buenos Aires tras 16 años: “El ritmo y el humor son universales”

Fabio Alberti regresa al teatro con Peperino Pómoro y revive el humor de los ‘90: “Cada día se me ocurren cosas nuevas”

El Chino Volpato relató cómo fue su lucha contra el cáncer para regresar a los escenarios: “Fue un baldazo de agua fría”

Leo Damario y Antonella Kruger, director y actriz de Solo Fanáticos: “El cine argentino no le daba lugar a mujeres así”

Pablo Echarri, el riesgo de creerse exitoso y el guiño a Guillermo Francella: “La realidad nos va juntando a todos”

INFOBAE AMÉRICA

Crisis en Cuba: los isleños hicieron sonar sus cacerolas en medio de un nuevo apagón nacional

Irán desafió a Donald Trump: el régimen dijo que atacará plantas energéticas y de desalinización en la región

La foca más grande del mundo y su piojo: un vínculo oculto y milenario que revela secretos del océano

Las imágenes más impactantes del ataque iraní contra dos ciudades de Israel que dejó al menos 140 heridos

Aura, creatividad y automatización, los dilemas de la creación artística en la era de la inteligencia artificial

Tesoros bibliográficos al servicio de la IA

Retos éticos y oportunidades globales

Temas Relacionados

Últimas Noticias

Argentina: lista de los 10 videos musicales que son tendencia en YouTube este día

La plataforma más popular de videos tiene presencia en 104 países y alrededor de cada minuto se suben a la plataforma 500 horas de contenido

YouTube en Colombia: la lista de los 10 videos más reproducidos que son tendencia hoy

Descubre quiénes son los artistas que han entrado al ranking con sus nuevos clips

El “padrino de la IA” afirma que las empresas solo se centran en los beneficios a corto plazo de esta tecnología

Geoffrey Hinton señala que la mayoría de las compañías tecnológicas solo buscan resultados rápidos con la inteligencia artificial

Ranking de tendencias en YouTube Chile: los 10 videos más reproducidos

La plataforma más popular de videos tiene presencia en 104 países y alrededor de cada minuto se suben a la plataforma 500 horas de contenido

Se acabaron los reinicios forzados: Microsoft permitirá pausar la actualizaciones en Windows indefinidamente

La nueva función llega tras múltiples problemas en actualizaciones recientes que afectaron la estabilidad y el arranque de miles de computadoras

La historia detrás del mito del colgante del Chino Maidana con el diente de Mayweather: el derechazo inolvidable que marcó la épica revancha

Jugó en la Selección y fue campeón con River Plate, aunque confiesa: “No lo disfruté como debía, me faltó patear el tablero”

Tras la victoria de Racing y la derrota de Independiente, así está la tabla del Torneo Apertura: el cronograma de la fecha 12

Racing le ganó 2-1 a Belgrano en Córdoba y se arrimó a la punta de su zona en el Torneo Apertura

Mariano Kestelboim, la reconversión que impulsa su carrera: título en Asunción y salto al top 100

Luke Cresswell, el creador de STOMP, antes de llegar a Buenos Aires tras 16 años: “El ritmo y el humor son universales”

Fabio Alberti regresa al teatro con Peperino Pómoro y revive el humor de los ‘90: “Cada día se me ocurren cosas nuevas”

El Chino Volpato relató cómo fue su lucha contra el cáncer para regresar a los escenarios: “Fue un baldazo de agua fría”

Leo Damario y Antonella Kruger, director y actriz de Solo Fanáticos: “El cine argentino no le daba lugar a mujeres así”

Pablo Echarri, el riesgo de creerse exitoso y el guiño a Guillermo Francella: “La realidad nos va juntando a todos”

INFOBAE AMÉRICA

Crisis en Cuba: los isleños hicieron sonar sus cacerolas en medio de un nuevo apagón nacional

Irán desafió a Donald Trump: el régimen dijo que atacará plantas energéticas y de desalinización en la región

La foca más grande del mundo y su piojo: un vínculo oculto y milenario que revela secretos del océano

Las imágenes más impactantes del ataque iraní contra dos ciudades de Israel que dejó al menos 140 heridos

Aura, creatividad y automatización, los dilemas de la creación artística en la era de la inteligencia artificial