Denuncian que obras de Stephen King, Atwood y Murakami son pirateadas para entrenar a la IA

Una publicación aseguró que más de 170.000 títulos se incorporaron a modelos de inteligencia artificial administrados por empresas sin el consentimiento de los autores, ni su correspondiente retribución

Guardar
Varios autores involuntariamente contribuyen a
Varios autores involuntariamente contribuyen a entrenar IA con sus obras pirateadas, revela The Atlantic (Foto: Reuters)

Escritores como Stephen King, Rachel Cusk, Zadie Smith, Margaret Atwood, Haruki Murakami y Elena Ferrante se encuentran entre los miles de autores cuyas obras pirateadas se han utilizado para entrenar herramientas de inteligencia artificial, según reveló un artículo que acaba de publicar la revista estadounidense The Atlantic .

Según la publicación, se cree que más de 170.000 títulos se incorporaron a modelos administrados por empresas como Meta y Bloomberg, aportando involuntariamente un formidable conjunto de datos que fue aprovechado por las firmas para construir sus herramientas de inteligencia artificial.

Te puede interesar: “La Justicia de EE.UU. dicta que los derechos de autor no protegen el arte creado por la IA”

La biblioteca Books3 se utilizó para entrenar LLaMA, uno de varios grandes modelos de lenguaje –aunque el más conocido es ChatGPT de OpenAI– diseñado para generar contenido basado en patrones identificados en textos de muestra. El conjunto de datos también se utilizó para entrenar BloombergGPT de Bloomberg, GPT-J de EleutherAI y es “probable” que se haya utilizado en otros modelos de IA, de acuerdo con la investigación de The Atlantic.

Hace unas semanas, escritores como
Hace unas semanas, escritores como Margaret Atwood, entre otros, remitieron una carta a las compañías para advertir que los nuevos proyectos de inteligencia artificial (IA) están explotando sus obras sin su consentimiento y sin respetar los derechos de autor

Los títulos contenidos en Books3 son aproximadamente un tercio de ficción y dos tercios de no ficción, y la mayoría se publicaron en las últimas dos décadas. Junto con los escritos de Smith, King, Cusk y Ferrante, las obras con derechos de autor en el conjunto de datos incluyen 33 libros de Margaret Atwood, al menos nueve de Haruki Murakami, nueve de bell hooks, siete de Jonathan Franzen, cinco de Jennifer Egan y cinco de David Grann.

También se incluyen libros de George Saunders, Junot Díaz, Michael Pollan, Rebecca Solnit y Jon Krakauer, así como 102 novelas pulp del fundador de Scientology L Ron Hubbard y 90 libros del pastor John MacArthur.

Los títulos abarcan editoriales grandes y pequeñas, incluidos más de 30.000 publicados por Penguin Random House, 14.000 de HarperCollins, 7.000 de Macmillan, 1.800 de Oxford University Press y 600 de Verso.

Stephen King (FOTO: @StephenKing)
Stephen King (FOTO: @StephenKing)

Esto se produce después de que una demanda presentada el mes pasado por tres escritores –Sarah Silverman, Richard Kadrey y Christopher Golden– alegara que sus obras protegidas por derechos de autor “fueron copiadas e ingeridas como parte del entrenamiento” del LLaMA de Meta. El análisis reveló que los escritos de los tres demandantes son efectivamente parte de Books3.

OpenAI, la empresa detrás del chatbot de IA ChatGPT, también ha sido acusada de entrenar su modelo en obras de reconocidos escritores.

Hace unas semanas, frente al avance sin regulación de estas nuevas tecnologías que permiten “clonar” modelos de escritura propios o ajenos, escritores como la canadiense Margaret Atwood y los estadounidenses Jonathan Franzen y Nora Roberts remitieron una carta a las compañías que pusieron en circulación estas facilidades para advertir que los nuevos proyectos de inteligencia artificial (IA) están explotando sus obras sin su consentimiento, sin respetar los derechos de autor y sin pagarles por eso.

Se ha alimentado la IA
Se ha alimentado la IA con, al menos, 9 libros de Haruki Murakami (Foto AP/Eugene Hoshiko,archivo)

“Es justo que nos compensen por utilizar nuestros escritos, sin los cuales la IA sería banal y extremadamente limitada”, alegaron los firmantes del texto, quienes explicaron que este desarrollo capaz de generar contenidos textos debe su existencia a sus escritos: “Estas tecnologías imitan y regurgitan nuestro lenguaje, historias, estilo e ideas. Millones de libros, artículos, ensayos y poesías protegidos por derechos de autor proporcional el ‘alimento’ a los sistemas de IA, comidas interminables por la que no se nos ha pasado factura”, expresaron por entonces.

Por su parte, Shawn Presser, el desarrollador de IA independiente que creó originalmente Books3, dijo que si bien simpatiza con las preocupaciones de los autores, creó la base de datos para que cualquiera pueda desarrollar herramientas de IA generativa y no se desentiende de los riesgos de que las grandes empresas tengan el control de la tecnología.

Desde la aparición de aplicaciones como ChatGPT, la tecnología tiene el atributo de escribir artículos o libros, componer música, representar imágenes a toda velocidad y hasta recrear la voz o la escritura de un artista fallecido: eso que durante tanto tiempo pareció ciencia ficción y anticiparon ficciones como Black Mirror ya es una realidad. Y los riesgos para el sector son grandes, ya que se está sustituyendo el trabajo de muchos actores culturales por la IA.

En la última década, los autores han sufrido un descenso del 40% en sus ingresos. Los escritores a tiempo completo vienen ingresaron en 2022 una renta media de 23.000 dólares, muy poco para los estándares estadounidenses.

Fuente: Télam S. E.

Seguir leyendo

Últimas Noticias

Comienza la Bienal de Historieta de Buenos Aires 2026, una celebración de la cultura del cómic

Hasta el domingo 22 en la Casa de la Cultura de Buenos Aires, con entrada libre y gratuita, se desarrollan jornadas con muestras, charlas y la participación de figuras internacionales del género

Comienza la Bienal de Historieta

Paul McCartney, Elton John y cientos de músicos logran una importante victoria contra la IA y fuerzan un cambio de rumbo en la protección de los derechos de autor

La industria musical del Reino Unido es la tercera más grande del mundo y aporta un 10% del consumo de música a nivel global, razón por la que las empresas tecnológicas están tan interesadas en entrenar sus programas de inteligencia artificial con sus canciones

Paul McCartney, Elton John y

El “destape” de Banksy sacude al mercado del arte: ¿Cuánto costarán sus obras a partir de ahora?

La revelación del verdadero nombre del artista callejero le hace perder la ventaja del anonimato y origina un debate sobre transparencia, autenticidad y seguridad legal en las subastas

El “destape” de Banksy sacude

“Los abrazos vacíos”: Silvio Rodríguez opinó sobre la crisis política, económica y social de Cuba

El cantautor publicó en su blog personal una extensa reflexión sobre el momento de aislamiento y desabastecimiento que vive su país, en un análisis geopolítico que comienza con una cita de Lacan

“Los abrazos vacíos”: Silvio Rodríguez

El New Museum de Nueva York reabre tras 2 años y una inversion de USD 82 millones

La reapertura permite que el público visite nuevos espacios y disfrute de una muestra con más de doscientos participantes de varias disciplinas, en un edificio que ha duplicado su superficie disponible

El New Museum de Nueva