IA & copyright : Anthropic bénéficie du fair use, mais devra réparer le piratage de milliers d’oeuvres

L’IA qui se joue du copyright. • Qant avec GPT-4o

Coup de théâtre ! Le 23 juin dernier, un juge californien a décidé que l’entraînement de Claude, le LLM d’Anthropic, avec des œuvres protégées par le copyright, bénéficie de l’exception pour « fair use », à condition que ces œuvres aient été acquises légalement. En revanche, le piratage de livres par le développeur d’IA n’est pas couvert par l’exception, et doit faire l’objet d’une réparation pour les auteurs lésés, réparation qui pourrait atteindre plusieurs milliards de dollars.

L’application, ou non, de l’exception pour usage équitable, ou « fair use » à l’entraînement des IA génératives avec des œuvres protégées par le droit d’auteur est au cœur des débats, avec près de quarante procès aux Etats-Unis, et de plus en plus de poursuites en Europe également. En février dernier, un jugement rendu dans le Delaware avait refusé l’application cette exception au droit d’auteur à l’usage de contenus protégés appartenant à Thomson Reuters par l’IA de recherche juridique développée par la société Ross. Dans une décision « sommaire » rendue le 23 juin, le juge William Alsup, de San Francisco, va dans le sens opposé, en concluant qu’Anthropic doit bénéficier de l’exception pour « fair use » pour l’entraînement de son LLM Claude avec des livres protégés par le droit d’auteur.

Cependant, il ressort du jugement qu’Anthropic ne peut pas bénéficier de cette exception au droit d’auteur pour la partie piratée de la base de données qui lui a permis d’entraîner Claude. Ce piratage fera l’objet d’un jugement en réparation d’ici plusieurs mois, dont la note finale pourrait s’avérer salée pour Anthropic. Certains observateurs l’évaluent à plusieurs milliards de dollars. !

Historique de l’affaire

Revenons d’abord sur l’historique de l’affaire. Une plainte contre Anthropic a été déposée le 19 août 2024 par les trois auteurs de livres Àndrea Bartz, Charles Graeber, et Kirk Wallace, avec l’idée d’en faire une « class action » ou action collective. Ils demandaient réparation à Anthropic pour l’utilisation de leurs œuvres à double titre : d’une part, dans une bibliothèque dématérialisée de tous les livres du monde montée par la société sur base de livres achetés, mais aussi de livres piratés, et d’autre part, pour l’usage de cette bibliothèque pour entraîner leur LLM Claude. Les auteurs ont estimé que leur copyright avait été enfreint, les deux usages ayant été réalisés sans leur autorisation et a fortiori, sans rémunération. Très tôt, Anthropic a soutenu qu’il n’y avait pas de violation de droit d’auteur, car les deux usages bénéficient de l’exception pour « fair use ».

Le 27 mars 2025, Anthropic a demandé à ce que le juge décide de l’applicabilité de cette exception de fair use en « summary judgment », une forme de jugement sur le fond accélérée et sans procès qui ressemble à un référé dans lequel il y aurait un jugement rapide sur le fond. Le 24 avril, les plaignants ont argué que le juge ne devrait pas prendre de décision sous cette forme, soulignant que le summary judgment ne peut être utilisé que si les deux parties sont d’accord sur les faits. Or, disaient les auteurs, « la défense d’Anthropic en matière de fair use soulève tout une série de questions factuelles ». Le juge a néanmoins décidé de juger de l’applicabilité du fair use en utilisant cette procédure.

Output

Le premier constat notable du juge Alsup concerne le fait que Claude ne permet pas à ses usagers de lire des extraits substantiels des œuvres en question : « Les auteurs n’arguent pas que les productions du LLM fournis aux utilisateurs portent atteinte à leurs œuvres. Notre dossier montre le contraire. Les utilisateurs n’ont interagi qu’avec le service Claude, qui a placé un logiciel supplémentaire entre l’utilisateur et le LLM sous-jacent pour s’assurer qu’aucun résultat contrefait ne parvienne jamais aux utilisateurs. »

Quatre conditions du fair use

Ensuite, il examine les quatre conditions de l’application du fair use, à savoir le but et le caractère de l’usage, la nature de l’œuvre protégée par le droit d’auteur, la quantité et l’importance de la portion de l’œuvre utilisée, et l’effet de l’utilisation sur le marché potentiel. Sur cette base, il explique que le but de l’usage est très transformatif, que l’utilisation de l’intégralité des œuvres est nécessaire pour cet usage. Sur la nature de l’œuvre protégée – à savoir si elle est originale ou non, il conclut que « le deuxième facteur va à l’encontre du fair use pour toutes les copies de la même manière. » Sur le quatrième facteur, à savoir l’effet sur le marché des œuvres protégées, le juge conclut en faveur du fair use pour les copies de livres acquises de manière légale par Anthropic, et à l’encontre du fair use pour les copies piratées.

Comme la jurisprudence fédérale antérieure l’y encourage, le juge soupèse les quatre conditions du fair use, et en déduit que « les copies utilisées pour former des LLM spécifiques étaient justifiées en tant que fair use. Tous les facteurs, à l’exception de la nature de l’œuvre protégée par le droit d’auteur, plaident en faveur de ce résultat. La technologie en question est l’une des plus transformatrices que beaucoup d’entre nous verront au cours de leur vie. » En somme, il semble que pour le juge Alsup le caractère transformatif est l’élément principal à prendre en compte en matière d’IA générative.

Fair use et entraînement

Il résulte de cette décision que, sauf appel probable des auteurs, l’exception pour fair use s’applique à l’entraînement de Claude avec des œuvres protégées acquises de manière légale. Il ne fait pas de doute que la question de la conciliation entre le jugement du juge Alsup et celui adopté dans le Delaware en février fera couler beaucoup d’encre. Comment en effet un répertoire aussi peu original que celui de Thomson Reuters – l’organisation de décisions de justice et leur résumé – peut-il être en dehors du champ de l’exception de fair use, alors que des livres orignaux y figureraient ? Et ce, rappelons-le, sur base du même droit : le droit américain du copyright est fédéral et généré par le Copyright Act… L’écart entre ces deux décisions ne permet décidément pas de deviner ce qui sera décidé dans les autres procès : il faudra avancer à vue. Pour une clarté juridique fiable, il semble qu’il faudra attendre que l’un de ces procès atterrisse devant la Cour suprême.

Mais cette application de l’exception pour fair use à l’entraînement d’IA ne doit pas obscurcir le fait que le juge Alsup affirme également qu’Anthropic devra être sanctionné pour son utilisation d'œuvres piratées. Si fair use il y a, elle ne sera donc acceptable que pour les œuvres acquises légalement. Pour les autres, il faudrait alors que les développeurs paient une réparation à tous les auteurs lésés qui leur feront un procès… Cela signifie aussi qu’à l’avenir, les développeurs devront faire en sorte de se rapprocher des ayants droit afin d’obtenir des copies licites de leurs œuvres. Cela sera t’il très différent d’une licence ? Les analystes des maisons d’édition, des labels, des producteurs d’images et des OGC sont sans nul doute en train d’y réfléchir en ce moment même …

Cet article d’Isabelle Szczepanski a initialement été publié le 25 juin sur Electron Libre.

L’essentiel