Classification automatique sur CanLII, première partie: Fonctionnalités

La classification automatique est une nouvelle fonctionnalité avancée d’intelligence artificielle que Lexum a développée pour le site Web de CanLII. Cette fonctionnalité de classification automatique exploite des algorithmes d’intelligence artificielle et des techniques de traitement du langage naturel pour classer automatiquement les documents juridiques par sujet. Pour ce projet, Lexum a utilisé son propre modèle de langue. La classification automatique améliore l’expérience de recherche sur le site Web de CanLII, ce qui permet aux utilisateurs de contextualiser plus facilement les items dans de longues listes de résultats de recherche.

À ce sujet, Lexum tient à remercier le Barreau de la Saskatchewan de nous avoir accordé l’accès à sa Digest Database et le Barreau de l’Ontario pour avoir contribué avec des Recueils de jurisprudence de l’Ontario. Ces deux organisations ont donné l’impulsion nécessaire à la mise en œuvre de la fonctionnalité de classification automatique sur CanLII.

Comment ça marche?

La classification automatique analyse le contenu et le contexte des documents juridiques. La classification automatique attribue des sujets aux documents sous forme de tags. Ces sujets incluent des domaines du droit, des thèmes juridiques, des juridictions, des niveaux de droit, etc. Les sujets sont intégrés aux extraits accompagnant les résultats de recherche, aux côtés des mots-clés alimentés par l’IA. Ils sont également disponibles sous forme de filtres de recherche sous l’onglet des décisions.

Ce nouveau système basé sur la langue a appris à partir des recueils de jurisprudence historiques, tels que les Recueils de la Cour suprême du Canada et les Recueils des Cours fédérales, ainsi que de nombreux autres, y compris ceux mentionnés plus haut.

Voici un exemple avec la recherche “enrichissement injustifié”:

Qu’est-ce qui est actuellement disponible et qu’est-ce qui ne l’est pas ?

À l’heure actuelle, le modèle de classification ne prend en charge que les décisions judiciaires. Toutes les décisions judiciaires canadiennes rédigées en anglais disponibles sur CanLII ont été traitées pour inclure les sujets. Cependant, les décisions administratives n’ont pas encore été traitées.

De plus, même si les sujets ont été traduits en français, la classification automatique n’inclut pas encore les décisions rédigées en français.

Qu’est-ce qui s’en vient ?

Inclure les décisions rédigées en français est notre priorité du moment. Traduire les balises est une chose, mais adapter le modèle de langage lui-même nécessite des efforts supplémentaires. Nous espérons être en mesure de prendre en charge le contenu en français prochainement.

Nous visons également à rendre les balises cliquables, afin que vous puissiez sélectionner tous les contenus en fonction du sujet correspondant.

Enfin, notre objectif est d’agglomérer des sujets et les mots-clés au sein d’un même paragraphe, étant donné que les sujets récemment ajoutés sont en réalité des mots-clés de haut niveau. Cela devrait permettre aux utilisateurs d’appréhender encore plus facilement la pertinence de chaque résultat de recherche par rapport à leurs besoins spécifiques.