Décidément la semaine dernière n’a pas été bonne pour les ayants-droit. Le 23, un juge de San Francisco a admis comme valide l’exception pour « fair use » dans l’affaire Bartz, opposant des auteurs de livres à la société d’IA générative Anthropic. C’est une déception pour le monde de la création, et ce même si le juge prévient qu’Anthropic va devoir payer une lourde réparation pour avoir utilisé des œuvres piratées pour construire la librairie qui a permis d’entraîner son LLM Claude (lire ci-dessous).
Le 24, un autre couperet est tombé : le juge Vince Chhabria, également issu de la District Court de San Francisco, a décidé de donner raison à Meta dans une affaire similaire, dans laquelle plusieurs auteurs de livres estimaient que Meta avait violé leur copyright en entraînant LLaMa avec leurs œuvres, sans autorisation. Chose étonnante, le juge Chhabria semble adopter sa décision à contrecœur, et prévient les développeurs d’IA que c’est du fait des mauvais arguments des auteurs qu’il a donné raison à Meta, mais qu’à l’avenir, il est probable qu’ils perdent la plupart de leurs procès.
Usage illégal dans la plupart des cas
Le juge Chhabria affirme dès l’introduction de sa décision que « étant donné que les performances d’un modèle d’IA génératif dépendent de la quantité et de la qualité des données qu’il absorbe dans le cadre de son apprentissage, les développeurs n’ont pas pu résister à la tentation d’introduire des éléments protégés par le droit d’auteur dans leurs modèles, sans obtenir l’autorisation des titulaires de droits d’auteur ou sans leur payer le droit d’utiliser leurs œuvres à cette fin. Cette affaire pose la question de savoir si un tel comportement est illégal. Bien que le diable soit dans les détails, dans la plupart des cas, la réponse sera probablement oui. » Il ajoute ensuite que « le droit d’auteur se préoccupe avant tout de préserver la motivation des êtres humains à créer des œuvres artistiques et scientifiques ».
Il précise même que la thèse – appréciée de certains en Europe – selon laquelle l’application du droit d’auteur empêcherait à l’IA de se développer ne tient pas la route : « La suggestion selon laquelle des décisions défavorables en matière de droit d’auteur arrêteraient cette technologie dans son élan est ridicule. » Puis, malgré cet argumentaire très favorable aux auteurs, et ainsi que nous l’avons déjà divulgâché, il adopte une décision en faveur de … Meta.
De l’importance d’être constant
Il s’agit donc de comprendre ce qui a amené le juge Chhabria à cette conclusion. Pour les développeurs d’IA, cette compréhension permettra de tenter d’éviter que la prophétie du juge – qui voit un comportement illégal dans l’entraînement d’IA avec des œuvres protégées dans la plupart des cas – ne se réalise. Pour les auteurs et autres ayants-droit, l’analyse du jugement devrait permettre, au contraire, de déployer à l’avenir des arguments plus convaincants.
Le jugement explique que, certes, dans la plupart des cas, les développeurs d’IA générative devront obtenir des autorisations et rémunérer les ayant-droit pour pouvoir entraîner leurs outils, et précise que c’est là une affirmation basée sur une compréhension générale du sujet. Mais, conclut le juge, « les tribunaux ne peuvent pas statuer sur des affaires en se fondant sur des conceptions générales. Ils doivent statuer sur la base des preuves présentées par les parties. »
Et c’est là que le bât blesse pour les auteurs, et, il faut le dire, pour leurs avocats. Le juge Chhabria déclare en effet que « en relation avec ces arguments de fair use, les plaignants proposent deux théories principales pour expliquer comment les marchés de leurs œuvres sont affectés par la copie de Meta. Ils affirment que Llama est capable de reproduire de petites portions de texte de leurs livres. Ils affirment également que Meta, en utilisant leurs œuvres pour la formation sans autorisation, a réduit la capacité des auteurs à accorder des licences pour leurs œuvres dans le but de former de grands modèles de langage ».
Le juge balaie donc ce double argumentaire des plaignants, expliquant que Llama n’a pas la capacité de générer une quantité significative de texte à partir des œuvres des plaignants, rendant ainsi leur utilisation peu pertinente. Il ajoute que les plaignants ne détiennent pas les droits sur le marché des licences pour que leurs œuvres soient utilisées comme données d’entraînement pour l’intelligence artificielle.
Puis, d’humeur sans doute généreuse, le juge oriente les auteurs vers « les arguments potentiellement gagnants », à savoir que « Meta a copié leurs œuvres pour créer un produit qui inondera probablement le marché avec des œuvres similaires, entraînant une dilution du marché ». Il tance les plaignants – et leurs avocats, en déplorant qu’à cet argument fondamental « les plaignants accordent à peine une attention superficielle (…) et ne présentent aucune preuve sur la façon dont les résultats actuels ou attendus des modèles de Meta dilueraient le marché de leurs propres œuvres. »
Occasion manquée
Au final, ce procès est une occasion manquée pour la vingtaine d’auteurs concernés, qui devront avoir des discussions tendues avec leurs avocats. Pour les prochains auteurs qui envisageraient des poursuites, il s’agira de démontrer l’effet négatif de l’entraînement d’IA avec des œuvres protégées sur le marché des œuvres similaires. C’est d’ailleurs ce qu’avait engagé à faire la décision Thomson Reuters v Ross. Pourquoi les avocats des auteurs qui ont porté plainte contre Meta n’ont pas suffisamment prêté attention à cette décision datant de février est un mystère…
Il est important de noter que dans sa décision, le juge Chhabria explique que Meta a tenté de se rapprocher de maisons d’éditions pour négocier des licences, avec un budget de 100 millions de dollars. Mais au fur et à mesure que les négociations avançaient, Meta s’est rendu compte que l’octroi de licences serait plus difficile que prévu. Le juge explique que « d’une part, les éditeurs ne détiennent généralement pas les droits subsidiaires de licence sur les livres destinés à l’apprentissage de l’IA. Ces droits sont détenus par des auteurs individuels et il n’existe pas d’organisation pour la concession collective de ces droits. »
Cet argument semble en contradiction avec ce que le juge affirme plus haut, à savoir que les auteurs ne détiennent pas les droits sur le marché des licences… Cela s’explique peut être par le fait que, plus loin dans sa décision, il explique qu’une négociation de licence oeuvre par oeuvre n’est pas envisageable, et engage les éditeurs à négocier, s’ils ne l’ont pas déjà fait, le transfert de ces droits par leurs auteurs, afin de pouvoir négocier des licences collectives en leur nom.
Cet article d’Isabelle Szczepanski a initialement été publié le 26 juin sur Electron Libre.