Comme mentionné dans un post précédent, la Conférence sur le droit via Internet est de retour avec une énergie renouvelée après une pause de trois ans. Nous ne pouvions ignorer cette magnifique opportunité de retrouver nos collègues du monde entier. La conférence a été organisée en collaboration avec le Centre d’informatique et de droit de la Faculté de droit de l’Université de Vienne et l’Institut d’information juridique autrichien LII-Autriche. Malgré l’appel de dernière minute pour les soumissions, la conférence a été un franc succès, à Vienne et en ligne, en réunissant des personnes du monde entier impliquées dans l’accès en ligne à l’information juridique.
Lexum a eu sa part de visibilité avec pas moins de trois présentations :
CatLII déchaîné : Analyse de cas par l’IA pour les décisions de CanLII
Frédéric Pelletier, VP Information juridique chez Lexum et Éditeur en chef de CanLII
Frédéric a présenté notre projet pilote CatLII qui utilise l’intelligence artificielle pour analyser et résumer les décisions judiciaires, et a fait le point concernant les nombreux défis ayant dû être relevés en cours de route. Au-delà de la simple envergure du projet, Frédéric a souligné le mandat de protéger la réputation de CanLII, une tâche qui peut s’avérer difficile lorsque l’IA peut être encline à halluciner. CatLII a relevé ce défi en limitant son analyse au texte de chaque décision et en intégrant des liens pointant vers les paragraphes du document original.
Cette année a aussi vu une série d’innovations majeures dans les grands modèles linguistiques (LLM), à tel point que chaque mois peut apporter un nouveau développement révolutionnaire. Pour s’y adapter, les outils développés par Lexum ont été conçus selon une approche flexible et modulaire, nous permettant des analyses comparatives pour éventuellement adopter les nouvelles technologies se révélant plus performantes ou efficace.
Exploiter les graphes de citations dans de vastes corpus pour améliorer la pertinence des requêtes générales
Marc-André Morissette, VP Technologie
Marc-André a détaillé les défis auxquels nous avons été confrontés en exploitant le réseau de citations avec un LLM personnalisé pour améliorer les résultats des requêtes de recherche. « Nous avons créé un algorithme qui analyse le réseau de citations d’un corpus et identifie les documents les plus cités dans le contexte de la requête de l’utilisateur. Les documents qui sont souvent cités sont supposés être plus fiables. Cette approche permet même de retrouver des documents pertinents qui ont été initialement manqués car ils ne contiennent pas les termes de la requête. » Le projet de Réseau de Citations améliore l’expérience de recherche de l’utilisateur à travers trois angles différents : recherche conceptuelle, recherche navigationnelle et améliorations générales des performances.
Dans l’ensemble, il offre un meilleur classement pour les requêtes larges basées sur des thèmes, ainsi que des requêtes de navigation. De plus, ces améliorations sont obtenues avec des temps de réponse équivalents à ce qu’ils étaient auparavant. Comme il est basé sur un modèle d’apprentissage, plus la base de données est grande, plus les résultats deviennent précis.
Qu’allons-nous construire après?
Ivan Mokanov, Président
Pour finir, Ivan a fourni au public un état de la situation chez Lexum et, à partir de là, nous a donné un aperçu des formidables fonctionnalités en cours de développement.
Pour commencer, CanLII peut être fier d’être maintenant reconnu comme la source de référence prioritaire pour la jurisprudence canadienne selon le Canadian Guide to Uniform Legal Citation, alias le Guide McGill. CanLII publie les décisions juridiques de 383 cours et tribunaux administratifs. Il publie également des lois consolidées pour toutes les juridictions avec une capacité de remonter 20 ans en arrière, des règlements consolidés pour toutes les juridictions et des lois annuelles pour toutes les juridictions. CanLII a le meilleur répertoire de droit primaire canadien : nous pouvons maintenant prétendre que si une référence n’est pas sur CanLII, elle n’existe pas.
Depuis 30 ans maintenant, la mission de Lexum a été de moderniser et de démocratiser l’édition juridique en automatisant des processus auparavant manuels. Notre vision était que la jurisprudence et la législation pouvait être rendues plus largement accessibles à moindre coût grâce à des processus automatisés. Voici quelques exemples de fonctionnalités que nous avons lancées au fil des ans : détection automatique et association de citations, extraction de mots-clés et de phrases clés, détection de quasi-doublons, extraction automatisée de métadonnées sur la jurisprudence et les lois, conversion automatique de documents, reconnaissance automatisée de la structure législative, analyse statistique du graphe de citations pour la pertinence de recherche, détection automatique des décisions nécessitant une anonymisation, segmentation des phrases et des paragraphes…
Pour la même raison, l’IA a été au cœur de bon nombre de nos initiatives récentes. À court terme, nous prévoyons nous concentrer sur quelques projets très concrets, tels que poursuivre à plus grande échelle l’analyse automatisées et les résumés de jurisprudence, ajouter des résumés législatifs, et produire des traductions automatisées. À plus long terme, nous travaillerons à améliorer le classement des résultats de recherche grâce à l’apprentissage machine, ce qui passe par le développement et la mise en œuvre de la recherche neuronale, entre autres choses.
Restez à l’écoute ! Des moments passionnants sont à venir.