La jurisprudence française au crible de l’IA

L’IA pour gérer le tribunal • Qant, M. de R. avec Midjourney

Une nouvelle étude propose un cadre pour l’utilisation de l’intelligence artificielle pour analyser les décisions judiciaires.

Le chercheur-entrepreneur Alexander Belikov (GrowGraph) et Sacha Raoult, de l’université Aix-Marseille, viennent de prépublier un article de recherche qui détaille une méthode novatrice pour construire des graphes de connaissances à partir de décisions de justice non structurées, en utilisant des modèles de langage de grande taille (LLM). Ils présentent un cadre intégrant une ontologie spécifique au domaine du droit pénal français et exploitent la base de données Judilibre.

Deux approches sont comparées : l'utilisation de graphes de propriétés et de triplets RDF (Resource Description Framework), la seconde démontrant une plus grande précision. L'étude évalue la performance du système, met en évidence l'importance de l'ontologie, et discute des applications potentielles, notamment l'analyse statistique et prédictive. Le travail souligne l'efficacité des LLM pour extraire et structurer des informations complexes à partir de documents juridiques.

L’objectif principal de cette recherche est de transformer des documents juridiques complexes et non structurés en graphes de connaissances exploitables. Ces graphes permettent de relier entre elles des entités et leurs relations, comme les infractions, les condamnations, ou les peines infligées.

La base de données utilisée, Judilibre, regroupe des décisions judiciaires françaises dans un format anonymisé. Chaque document contient des informations détaillées sur les faits reprochés, les décisions des tribunaux, les recours et les sanctions. La richesse de ces données en fait une ressource précieuse, mais leur structuration manuelle est une tâche laborieuse. C’est là que l’intelligence artificielle peut intervenir.

Une approche technologique innovante

Deux méthodes principales ont été mises en œuvre. La première repose sur l’utilisation de graphes de propriétés, en exploitant des outils comme llama_index et Neo4j, une base de données spécialisée dans la gestion des graphes. La seconde approche utilise des triplets RDF, qui permettent de représenter des relations sous une forme standardisée et interopérable.

Les chercheurs ont également conçu une ontologie spécifique au droit pénal pour modéliser les concepts centraux comme les rôles des acteurs (victimes, accusés), les types de sanctions (amendes, détention), ou encore les recours juridiques. L’intégration de ces éléments a été réalisée en collaboration avec des modèles de langage avancés, ce qui a permis d’affiner l’extraction d’informations à partir des documents bruts.

Des résultats concrets et mesurables

L’étude s’est appuyée sur un échantillon de 2 820 décisions judiciaires, principalement issues de l’année 2023. Chaque décision a généré en moyenne une trentaine de relations distinctes sous forme de triplets RDF, représentant des données telles que les durées de peine, les montants des amendes ou les recours exercés.

Les performances de ces outils ont été mesurées avec précision. La méthode RDF a obtenu un taux de précision de 93 % et un rappel de 89 %, surpassant l’approche basée sur les graphes de propriétés. Ces résultats montrent que la structuration automatisée des données judiciaires est non seulement faisable, mais également fiable pour des analyses ultérieures.

Un point notable de l’étude concerne les corrélations entre certaines variables. Par exemple, les durées des peines ou les montants des amendes semblent avoir un impact limité sur les décisions finales, suggérant que d’autres critères, souvent implicites, jouent un rôle central.

Des perspectives pour le futur

L’utilisation de l’intelligence artificielle dans l’analyse des décisions judiciaires ouvre des perspectives dans le domaine de la gestion des connaissances juridiques. Ces graphes permettent d’interroger rapidement de vastes corpus de textes pour répondre à des questions complexes. Ils peuvent également être utilisés pour prédire des tendances ou analyser des évolutions dans les décisions des tribunaux.

Cependant, les chercheurs soulignent les limites actuelles de leur approche. La qualité des graphes dépend directement de l’ontologie utilisée et de l’entraînement des modèles. Des améliorations pourraient être apportées, notamment par le développement d’outils plus spécialisés dans le domaine juridique et une meilleure intégration des données dans des bases vectorielles.

Pour en savoir plus :

L’essentiel