IA générative : Nouvelle plainte contre Meta pour violation du droit d'auteur
Le dirigeant de Meta, Mark Zuckerberg est accusé d’avoir donné son accord pour l’entrainement de ses modèles de langage Llama avec des œuvres protégées par le copyright et provenant d’une vaste base de données piratée. Le réseau social se défend en affirmant que l’exploitation des ouvrages en question relève du "fair use" (usage raisonnable) du droit américain.
Des documents compromettants ont été remis le 8 janvier dernier à un tribunal californien dans le cadre d’une nouvelle affaire de violation des droits d’auteur opposant la multinationale technologique, Meta à trois auteurs américains (les romanciers Richard Kadrey et Christoper Golden ainsi que la comédienne Sarah Silverman) qui lui reprochent d’avoir utilisé leurs œuvres pour entraîner des modèles d’IA sans autorisation ni aucune offre de compensation.
Une bibliothèque numérique controversée
Les documents affirment que Meta a téléchargé le contenu d'œuvres protégées compilées dans Library Genesis – alias "LibGen", une énorme base de données de contenus piratés qui a fait elle-même l’objet de plaintes en 2023 de la part de groupes d'édition américains spécialisés dans l'éducation, la recherche et les contenus pédagogiques
En effet, en septembre dernier, la justice américaine a décidé de bloquer la plateforme (qui comporte 33 millions de livres et 84 millions d'articles en accès libre) et d’infliger une amende de 30 millions d’euros à ses créateurs. Or selon la nouvelle plainte contre Meta, Mark Zuckerberg, fondateur et dirigeant de l'entreprise, aurait lui-même approuvé l’utilisation de LibGen pour entrainer les modèles d'IA de l’entreprise, connus sous le nom de Llama.
"Les avocats des auteurs accusent Meta d'avoir traité la soi-disant disponibilité publique des ensembles de données clandestins comme un laissez-passer, en dépit du fait que les dossiers internes de Meta montrent que tous ses décideurs, y compris son CEO, Mark Zuckerberg, étaient conscients que LibGen était un ensemble de données piratées", a affirmé une source proche de la défense au magazine américain Wired.
Les craintes des employés de Meta
Des discussions en interne qui ont fuité montrent par ailleurs que certains employés de Meta savaient que l’utilisation de la base de données clandestine, pouvait porter préjudice à l’entreprise. "Si les médias suggèrent que nous avons utilisé un ensemble de données que nous savons piratées, tel que LibGen, cela pourrait nuire à notre position de négociation avec les autorités de réglementation sur ces questions", aurait ainsi expliqué un des développeurs.
Dans un mémo présenté devant le tribunal, les avocats de Meta ont affirmé que leur client n’a pas enfreint la loi sur les droits d’auteurs et qu’il n’y a pas de preuves sur l’utilisation de LibGen comme base de données pour l’entrainement de ses modèles d'IA. Ils ont aussi mis en avant une disposition de la réglementation américaine, en l’occurrence "l’usage raisonnable" (Fair Use en anglais), un principe légal selon lequel l'utilisation d'éléments protégés par des droits d'auteur est autorisée, dans certaines circonstances, sans l'autorisation du titulaire des droits. Une défense fréquemment mise en avant par les entreprises développant des modèles d'IA, comme OpenAI.
Il est à noter que la premiere plainte des auteurs contre Meta pour violation du droit d’auteur date de 2023. Une autre plainte a ciblé OpenAI et l’entraînement de ChatGPT.
IA générative : Nouvelle plainte contre Meta pour violation du droit d'auteur
Tous les champs sont obligatoires
0Commentaire
Réagir