Pillage d'œuvres : Anthropic gagne une manche au tribunal grâce au "fair use"
La start-up a bénéficié du principe de "fair use" pour cette fois-ci, une défense juridique clé pour les entreprises technologiques. La décision du juge chargé de l'affaire est une grande première pour le domaine de l'IA générative. Reste que si l'usage est effectivement "fair", la copie et le stockage des quelques 7 millions de livres vaut à Anthropic de retourner devant la justice en décembre prochain.
Anthropic vient de remporter une belle manche. Un juge fédéral de San Francisco a statué lundi soir que l’utilisation, sans autorisation, de livres par Anthropic pour entraîner son système d’intelligence artificielle était légale au regard du droit d’auteur américain.
S'alignant sur la position de nombreuses entreprises technologiques dans une question cruciale pour le secteur de l’IA, le juge William Alsup a estimé dans sa décision qu’Anthropic avait fait un "usage équitable" (fair use) des ouvrages des écrivains Andrea Bartz, Charles Graeber et Kirk Wallace Johnson pour entraîner son LLM Claude.
Une violation du droit d'auteur sous le nez des auteurs concernés
Pour mémoire, les trois plaignants - auteurs de divers ouvrages de fiction et de non-fiction - ont intenté une action en justice en août 2024 en vertu du Copyright Act "pour réparer le préjudice causé par la violation flagrante d’Anthropic". La cause ? "Anthropic a téléchargé des versions piratées connues des œuvres des plaignants, en a fait des copies et a injecté ces copies piratées dans ses modèles, afin d’aider des algorithmes à générer des réponses textuelles de type humain", peut-on lire dans la plainte.
Les auteurs accusent la société de n'avoir "même pas tenté de dédommager les plaignants pour l’utilisation de leur matériel. En réalité, la société a pris plusieurs mesures pour dissimuler l’ampleur de son piratage". Et de poursuivre : "Ces LLM, qui diluent le marché commercial des œuvres des plaignants, ont été élaborés sans verser un centime aux auteurs". Certes. Mais le juge a tranché, en faveur d'Anthropic, du moins pour cette fois-ci.
Un nouveau procès en décembre pour statuer sur les 7 millions de livres piratés
En effet, le juge William Alsup a ajouté que la copie et le stockage de plus de 7 millions de livres piratés dans une "bibliothèque centrale" violaient les droits d’auteur des auteurs et ne relevaient pas de l’usage équitable, cette bibliothèque n'étant apparemment pas nécessairement utilisée à des fins d'entraînement de l'IA. Il a fixé un procès en décembre afin de déterminer le montant que doit Anthropic pour cette contrefaçon.
Pour rappel, le droit d’auteur américain prévoit que la contrefaçon volontaire peut entraîner des dommages-intérêts statuaires allant jusqu’à 150 000 dollars par œuvre. Il faut préciser un détail important de cette affaire : Anthropic semble s'être donné un mal fou pour se procurer ces fameux livres, achetant ainsi un exemplaire de chaque livre qu'elle avait auparavant téléchargé illégalement.
Plusieurs millions de dollars dépensés pour acheter ces fameux livres
La société a dépensé plusieurs millions de dollars pour acheter des millions de livres imprimés, souvent d’occasion. Ses prestataires ont ensuite retiré la reliure des ouvrages, découpé les pages au format voulu, puis numérisé les livres - les exemplaires papier étant finalement jetés.
On apprend ainsi par la décision de justice que chaque livre physique a donné lieu à un fichier PDF contenant des images des pages scannées avec du texte lisible par machine (y compris les scans des première et quatrième de couverture pour les livres brochés). "Anthropic a constitué son propre catalogue de métadonnées bibliographiques pour les ouvrages qu’elle acquérait. Elle a obtenu des copies de millions de livres, y compris tous ceux concernés dans la présente affaire pour chacun des auteurs", est-il précisé.
Le "fair use" a bon dos
In fine, l'ordonnance accorde à Anthropic un jugement sommaire concluant que l’usage des exemplaires à des fins d’entraînement constituait un "fair use", tout comme, pour un motif différent, elle conclut aussi que la conversion du format imprimé au format numérique relève elle-même du "fair use". Un porte-parole d’Anthropic s’est déclaré satisfait que le tribunal ait reconnu que l’entraînement de l’IA était "conforme à l’objectif du droit d’auteur, qui est de favoriser la créativité et le progrès scientifique".
SUR LE MÊME SUJET
Pillage d'œuvres : Anthropic gagne une manche au tribunal grâce au "fair use"
Tous les champs sont obligatoires
0Commentaire
Réagir