El reclamo de Encyclopedia Britannica y Merriam-Webster contra OpenAI enfatiza que el avanzado desempeño de ChatGPT, según las empresas demandantes, no sería posible sin la utilización del trabajo desarrollado por investigadores, escritores y editores humanos. La demanda sostiene que OpenAI se habría beneficiado “masivamente” al replicar información protegida a través de la tecnología de sus sistemas automatizados, un proceder que, siempre basado en el texto presentado ante el Tribunal de Distrito Sur de Nueva York, habría acarreado un perjuicio directo al tráfico y los ingresos de los portales originales. Encyclopedia Britannica y Merriam-Webster interponen la demanda buscando que la justicia determine el reconocimiento de daños y perjuicios, la restitución de las potenciales ganancias obtenidas por OpenAI con estos métodos, además de la imposición de medidas para prohibirles, en forma permanente, las conductas descritas. Según publicó el medio que reportó la demanda, la queja central reside en que los sistemas de inteligencia artificial de OpenAI no solo copian material protegido, sino que presentan respuestas que desplazan el tráfico ordinario y la consulta a los sitios web titulares de los derechos.
De acuerdo con la información consignada por el medio que reportó el registro judicial, el planteamiento de las empresas editoriales se basa en la diferencia fundamental entre motores de búsqueda convencionales y servicios como ChatGPT. Los motores de búsqueda tradicionales proveen enlaces hacia fuentes externas, lo que incrementa la visibilidad y el flujo de visitantes hacia los sitios web de los creadores de contenido, quienes pueden así obtener ingresos. En cambio, detallan que ChatGPT responde de manera directa a las preguntas de los usuarios, lo que evita que estos visiten el sitio original, lo que desencadenaría una reducción o “canibalización” del tráfico que normalmente recibirían plataformas como Merriam-Webster y Encyclopedia Britannica.
En el escrito presentado ante el tribunal, las editoriales argumentan que la IA de OpenAI replica información de obras protegidas sin solicitar autorización ni establecer acuerdos de compensación. Según reportó el medio, la demanda sostiene que la utilización masiva de este contenido resulta indispensable para el entrenamiento de los modelos de lenguaje de gran tamaño (LLM, por sus siglas en inglés) de OpenAI, que dependen de altos volúmenes de textos de calidad para entrenar sus sistemas automatizados y, posteriormente, generar respuestas para sus usuarios. Los demandantes consideran que esta práctica constituye una infracción de derechos de autor porque no se limita al uso para investigación, sino que el contenido replicado se incorpora a productos sustitutivos y compite directamente con los originales.
El medio que reportó la noticia también especifica que la denuncia de las editoriales destaca el uso reiterado de contenidos procedentes de sus bases de datos, tanto durante el proceso de entrenamiento original como al momento de generar respuestas con tecnologías como los sistemas RAG (Retrieval Augmented Generation, sistemas automatizados de recuperación y generación). Estas herramientas permiten a los modelos formular textos ampliados y mejorar la precisión de la información entregada, de modo que, según los demandantes, el resultado presentado a los usuarios resulta “sustancialmente similar” a los artículos, definiciones y entradas originales de Britannica y Merriam-Webster.
Además, en la demanda se argumenta que OpenAI, a través de ChatGPT, no solo incurre en la infracción masiva de derechos de autor sobre los textos, sino también en la violación de marcas registradas. Los editoriales alegan que en ocasiones el sistema genera respuestas que incluyen “alucinaciones”, es decir, información inventada presentada bajo el nombre de las marcas Britannica o Merriam-Webster, lo que afectaría la integridad y reputación de los titulares originales frente a su audiencia y podría derivar en confusión entre los usuarios.
Según publicó el medio que accedió a los documentos de la querella, Britannica y Merriam-Webster solicitan que se detenga permanentemente la conducta denunciada y se ordene la reparación de los daños ocasionados, incluyendo la devolución de las posibles ganancias obtenidas por OpenAI a partir del uso de las obras registradas. Las compañías hacen énfasis en que la información que sustenta sus productos es fiable y resultado del trabajo curado de profesionales, agregando que las conductas señaladas impactan el modelo económico que permite financiar la producción y actualización de contenidos educativos y de consulta.
Las empresas editoriales, a través de esta demanda, buscan sentar precedente sobre el uso de obras protegidas en el desarrollo de inteligencia artificial aplicada a la generación y distribución de información, en un contexto donde el acceso automatizado a grandes bases de datos es un componente vital en la carrera por el avance tecnológico, tal como lo reflejan los argumentos presentados frente al tribunal de Nueva York.