Menu

Filter op
content
PONT Data&Privacy

0

AI-Alert: training van AI systemen valt onder Amerikaanse fair use-exceptie

Een baanbrekend oordeel in de zaak Bartz versus Anthropic: volgens Amerikaanse rechter William Alsup kwalificeert het trainen van AI systemen met behulp van auteursrechtelijk beschermde werken als fair use.

25 June 2025

In augustus 2024 startten de Amerikaanse auteurs Andrea Bartz, Charles Graerber en Kirk Wallace Johnson een rechtszaak tegen Anthropic, het bedrijf achter AI chatbot Claude. Volgens de auteurs maakte Anthropic inbreuk op hun auteursrechten door kopieën van hun werk op te nemen in een algemene databibliotheek. Deze bibliotheek bestaat uit een dataset die het bedrijf gebruikt om haar Large Language Models (LLMs) te trainen.

De toenmalige Head of Partnerships kreeg van Anthropic de opdracht om ‘all the books in the world‘ te verzamelen voor het samenstellen van de dataset. De bibliotheek bestaat uit teksten uit zowel legaal gekochte als illegaal gedownloade (kopieën van) boeken. Anthropic kocht miljoenen fysieke, veelal tweedehandse, boeken die zij handmatig inscande en omzette naar PDF-bestanden. Daarnaast downloadde zij miljoenen kopieën van boeken van de websites Book3, Library Genenis en Pirate Library Mirror.

Vervolgens selecteerde Anthropic welke teksten uit deze dataset het meest geschikt waren voor de training van specifieke LLMs. Deze teksten werden samengevoegd tot subsets. De teksten in deze subsets werden getokeniseerd en vervolgens gebruikt voor de training van haar LLMs.

Volgens Anthropic was het (illegaal) kopiëren van boeken gerechtvaardigd, omdat dit volgens het bedrijf noodzakelijk was voor de training van haar LLMs.

Of Anthropic de boeken mocht kopiëren wordt beoordeeld aan de hand van de Amerikaanse fair use-exceptie. Daarbij kijkt de rechter naar verschillende factoren, zoals het doel en het karakter van het gebruik, de aard van het beschermde werk en de hoeveelheid en proportionaliteit van het gebruikte materiaal.

Het oordeel van rechter Alsup is duidelijk. Het trainen van AI met behulp van teksten uit boeken is toegestaan onder de Amerikaanse fair use-exceptie.

Alsup oordeelt meer genuanceerd over het samenstellen van de algemene bibliotheek. Volgens Anthropic was het mogelijk dat zij de bibliotheek nog voor andere doelen dan het trainen van LLMs wilde gebruiken. Echter valt ook dit gebruik van de auteursrechtelijk beschermde werken onder de fair use-uitzondering. Hierbij is doorslaggevend dat de fysieke boeken na het inscannen zijn weggegooid en dat de digitale versies niet verder zijn verspreid. De digitale bestanden vervingen de fysieke exemplaren. Dit gebruik valt dus onder transformative use, oftewel gebruik dat een nieuw doel dient of nieuwe betekenis heeft.

Anders is het oordeel van Alsup over de illegale kopieën. Anthropic downloadde ruim zeven miljoen boeken zonder daarvoor te betalen.  Volgens Alsup bestaat er geen rechtvaardiging voor het illegaal downloaden van boeken die ook legaal te koop zijn of op andere toegestane manieren verkregen kunnen worden. Bovendien bewaarde Anthropic deze illegale kopieën niet alleen voor het trainen van LLMs. Zoals eerder benoemd, werden ook deze kopieën bewaard in de bibliotheek voor andere mogelijke doeleinden.

Ook in andere lopende procedures is de fair use-exceptie aangevoerd als verweer tegen beschuldigingen van auteursrechtinbreuk. Het moet nog blijken of deze uitspraak richtinggevend zal zijn voor de oordelen van rechters in die zaken.

Artikel delen