Meta

Juridique

Droits numériques

IA générative : Nouvelle plainte contre Meta pour violation du droit d'auteur

Le dirigeant de Meta, Mark Zuckerberg est accusé d’avoir donné son accord pour l’entrainement de ses modèles de langage Llama avec des œuvres protégées par le copyright et provenant d’une vaste base de données piratée. Le réseau social se défend en affirmant que l’exploitation des ouvrages en question relève du "fair use" (usage raisonnable) du droit américain.

Samia Lokmane

14 janvier 2025 \ 06h30

2 min. de lecture

Réagir

Mon actualité personnalisable

Profitez à tout moment des informations clés selon vos intérêts.

Sélectionnez les thèmes qui vous intéressent :

Gérer mes thèmes favoris

2 min. de lecture

Réagir

Samia Lokmane

14 janvier 2025 \ 06h30

IA générative : Nouvelle plainte contre Meta pour violation du droit d'auteur

Des documents compromettants ont été remis le 8 janvier dernier à un tribunal californien dans le cadre d’une nouvelle affaire de violation des droits d’auteur opposant la multinationale technologique, Meta à trois auteurs américains (les romanciers Richard Kadrey et Christoper Golden ainsi que la comédienne Sarah Silverman) qui lui reprochent d’avoir utilisé leurs œuvres pour entraîner des modèles d’IA sans autorisation ni aucune offre de compensation.

Une bibliothèque numérique controversée

Les documents affirment que Meta a téléchargé le contenu d'œuvres protégées compilées dans Library Genesis – alias "LibGen", une énorme base de données de contenus piratés qui a fait elle-même l’objet de plaintes en 2023 de la part de groupes d'édition américains spécialisés dans l'éducation, la recherche et les contenus pédagogiques

En effet, en septembre dernier, la justice américaine a décidé de bloquer la plateforme (qui comporte 33 millions de livres et 84 millions d'articles en accès libre) et d’infliger une amende de 30 millions d’euros à ses créateurs. Or selon la nouvelle plainte contre Meta, Mark Zuckerberg, fondateur et dirigeant de l'entreprise, aurait lui-même approuvé l’utilisation de LibGen pour entrainer les modèles d'IA de l’entreprise, connus sous le nom de Llama.

"Les avocats des auteurs accusent Meta d'avoir traité la soi-disant disponibilité publique des ensembles de données clandestins comme un laissez-passer, en dépit du fait que les dossiers internes de Meta montrent que tous ses décideurs, y compris son CEO, Mark Zuckerberg, étaient conscients que LibGen était un ensemble de données piratées", a affirmé une source proche de la défense au magazine américain Wired.

Les craintes des employés de Meta

Des discussions en interne qui ont fuité montrent par ailleurs que certains employés de Meta savaient que l’utilisation de la base de données clandestine, pouvait porter préjudice à l’entreprise. "Si les médias suggèrent que nous avons utilisé un ensemble de données que nous savons piratées, tel que LibGen, cela pourrait nuire à notre position de négociation avec les autorités de réglementation sur ces questions", aurait ainsi expliqué un des développeurs.

Dans un mémo présenté devant le tribunal, les avocats de Meta ont affirmé que leur client n’a pas enfreint la loi sur les droits d’auteurs et qu’il n’y a pas de preuves sur l’utilisation de LibGen comme base de données pour l’entrainement de ses modèles d'IA. Ils ont aussi mis en avant une disposition de la réglementation américaine, en l’occurrence "l’usage raisonnable" (Fair Use en anglais), un principe légal selon lequel l'utilisation d'éléments protégés par des droits d'auteur est autorisée, dans certaines circonstances, sans l'autorisation du titulaire des droits. Une défense fréquemment mise en avant par les entreprises développant des modèles d'IA, comme OpenAI.

Il est à noter que la premiere plainte des auteurs contre Meta pour violation du droit d’auteur date de 2023. Une autre plainte a ciblé OpenAI et l’entraînement de ChatGPT.

Sélectionné pour vous