La batalla legal sobre el uso de datos para entrenar modelos de inteligencia artificial acaba de sumar a uno de los nombres más reconocidos en la publicación de referencia: Encyclopaedia Britannica y su filial Merriam-Webster han presentado una demanda contra OpenAI en un tribunal federal de Manhattan.

El núcleo de la demanda
El escrito acusa a OpenAI de haber copiado cerca de 100,000 artículos de Britannica, incluyendo entradas de enciclopedia y definiciones de diccionario, para entrenar sus modelos de lenguaje sin autorización. Según Britannica, esto permite que ChatGPT genere respuestas que reflejan casi palabra por palabra su propio contenido, desviando tráfico de sus plataformas y debilitando sus ingresos.
La demanda afirma que OpenAI “cannibalizó” el tráfico de Britannica al ofrecer resúmenes generados por IA que sustituyen la consulta directa a sus sitios web.
La respuesta de OpenAI

OpenAI rechazó las acusaciones, señalando que sus modelos se entrenan con datos disponibles públicamente y que el proceso está amparado por el principio de “fair use” en la legislación estadounidense. La compañía sostiene que los modelos no reproducen obras originales, sino que transforman el material en patrones estadísticos.
Argumentos de Britannica

Britannica disputa esa interpretación y asegura que ChatGPT puede producir pasajes “casi verbatim” de sus entradas, lo que reduce el incentivo de los usuarios para visitar sus plataformas. Además, la demanda incluye reclamos de marca registrada, acusando a OpenAI de citar a Britannica en respuestas que contienen errores, lo que la compañía describe como “alucinaciones falsas” que dañan su reputación.
Lo que pide Britannica
La editorial solicita:
- Daños monetarios por el uso no autorizado de su contenido.
- Una orden judicial que bloquee el uso futuro de sus materiales en los sistemas de OpenAI.
Un frente legal más amplio
Este caso se suma a una creciente lista de demandas contra desarrolladores de IA en EE.UU. Autores, medios y organizaciones periodísticas han presentado reclamos similares, incluyendo The New York Times, Chicago Tribune y Center for Investigative Reporting (CIR). Todos argumentan que sus obras fueron copiadas sin consentimiento para entrenar modelos generativos.
OpenAI y otras empresas insisten en que el entrenamiento con grandes volúmenes de datos constituye un uso transformativo y legítimo. Sin embargo, los tribunales aún no han definido con claridad si este proceso cruza la línea del derecho de autor.
Implicaciones

Para Britannica, el asunto va más allá de la teoría legal: su prestigio se ha construido durante siglos como fuente confiable de conocimiento, y ahora ese mismo acervo podría estar en el corazón del auge de la IA generativa.
El resultado de este caso podría marcar un precedente crucial: determinar hasta qué punto las empresas de IA pueden usar materiales protegidos para entrenar sus modelos y quién debe ser compensado cuando lo hacen.
La demanda de Britannica contra OpenAI refleja el choque entre el valor histórico de las fuentes de referencia y el avance de la inteligencia artificial. El fallo judicial no solo afectará a las partes involucradas, sino que podría redefinir las reglas del juego para todo el ecosistema de IA y publicación digital.
