Acusan a Nvidia de usar millones de libros sin permiso para entrenar su inteligencia artificial

La denuncia señala que la compañía habría accedido a bases de datos piratas como Anna’s Archive, pese a estar advertida de que los contenidos se habían obtenido de forma ilegal

Nvidia es acusada de usar libros pirata para entrenar su IA. (Nvidia)

Nvidia, la empresa más valiosa del mundo y uno de los pilares del auge actual de la inteligencia artificial, enfrenta una nueva y delicada acusación judicial. Un grupo de escritores amplió una demanda en Estados Unidos en la que señala a la compañía por haber utilizado, presuntamente sin autorización, millones de libros protegidos por derechos de autor para entrenar sus modelos de inteligencia artificial.

Según la denuncia, el material habría sido obtenido a través de bases de datos piratas, una práctica que reaviva el debate global sobre los límites legales del entrenamiento de sistemas de IA.

La acción legal fue presentada ante el Tribunal de Distrito del Norte de California, en la división de Oakland, y sostiene que Nvidia habría recurrido a Anna’s Archive, una conocida base de datos que aloja millones de libros y textos académicos distribuidos de manera ilegal. La acusación fue revelada por el sitio especializado TorrentFreak, que tuvo acceso a documentos incluidos en la demanda.

Read more!
Nvidia habría acudido a archivos ilegales para entrenar a su IA. REUTERS/Dado Ruvic/Illustration/File Photo

De acuerdo con el escrito judicial, representantes de Nvidia habrían intercambiado correos electrónicos con los administradores de Anna’s Archive para explorar una posible colaboración. En esos mensajes, la empresa reconoce que estaba “evaluando incluir Anna’s Archive en los datos de preentrenamiento” de sus modelos de lenguaje de gran escala (LLM, por sus siglas en inglés), aunque también admite que analizaba internamente los riesgos legales de hacerlo.

Uno de los puntos más sensibles del caso es que, según los demandantes, los propios administradores de la base de datos advirtieron a Nvidia que los contenidos disponibles habían sido obtenidos por medios ilegales.

A pesar de esa aclaración, la denuncia asegura que la compañía habría llegado a un acuerdo apenas una semana después para acceder a ese material, que podría sumar hasta 500 terabytes de datos, una cantidad masiva incluso para los estándares actuales del sector.

Nvidia habría tenido acceso a los archivos de Anna’s Archive, pese a que es ilegal. REUTERS/Dado Ruvic/Ilustración

Un nuevo capítulo de un conflicto que viene de antes

Esta no es la primera vez que Nvidia queda en el centro de una controversia de este tipo. La demanda actual amplía una acción judicial presentada en 2024 por un grupo de autores, que sigue en proceso. En aquel caso, los escritores acusaron a la compañía de haber utilizado la base de datos Book3, un conjunto de miles de libros protegidos por copyright que habría sido compilado a partir de la biblioteca pirata Bibliotik.

Según esa denuncia previa, Nvidia no solo habría usado ese material para entrenar sus propios modelos de inteligencia artificial, sino que también habría permitido que socios comerciales accedieran a la base de datos, lo que habría multiplicado el impacto de la supuesta infracción. Los demandantes sostienen que esas prácticas generaron beneficios económicos directos para la empresa, sin que los autores recibieran compensación alguna.

En la nueva ampliación, los escritores reclaman indemnizaciones económicas proporcionales a los ingresos obtenidos por Nvidia gracias al uso no autorizado de sus obras. El argumento central es que los modelos de inteligencia artificial entrenados con ese material se han convertido en productos comerciales altamente rentables, lo que refuerza la gravedad de la presunta vulneración de derechos de autor.

Escritores buscan ser indemnizados tras descubrir que Nvidia habría usado sus textos de manera ilegal. REUTERS/Dado Ruvic/Illustration/File Photo

Una empresa en la cima del mercado

Las acusaciones llegan en un momento clave para Nvidia. La compañía dirigida por Jensen Huang atraviesa su mejor etapa financiera: desde hace meses lidera el ranking de empresas más valiosas del mundo y ya supera los 4,5 billones de dólares de capitalización bursátil, por encima de gigantes históricos como Apple y Google.

Ese crecimiento está directamente vinculado a la explosión de la inteligencia artificial generativa. Los chips de Nvidia son el estándar de facto para entrenar y ejecutar modelos avanzados, lo que la ha convertido en un actor central del ecosistema tecnológico global. Sin embargo, esa posición dominante también la expone a mayores escrutinios regulatorios y legales.

Además del frente judicial por derechos de autor, Nvidia enfrenta otros desafíos geopolíticos y comerciales. A finales de 2025, el entonces presidente Donald Trump desbloqueó parcialmente la venta de chips de IA a China, pero el propio país asiático ha mostrado reticencias a permitir su ingreso, en medio de tensiones comerciales y estratégicas.

Read more!