Apprendre du réseau de citations ou comment améliorer vos résultats de recherche avec l’IA

Lexum investit fortement dans l’intelligence artificielle (IA) pour mettre en Å“uvre de nouvelles fonctionnalités et améliorer l’expérience utilisateur de ses clients. Dernièrement, nous avons travaillé sur une fonctionnalité d’amélioration de la recherche pour CanLII qui apprend à partir du réseau de citations entre les décisions de jurisprudence, et cela améliore grandement la qualité des résultats. Cette nouvelle fonctionnalité optimise la recherche grâce aux liens neuronaux et aux modèles d’apprentissage de la langue.

Le projet Réseau de citations est un boost d’IA conçu pour affiner et conceptualiser le moteur de recherche. Il fonctionne autour de trois concepts différents : la recherche conceptuelle, la recherche navigationnelle et l’amélioration générale des performances.

Recherche conceptuelle

La recherche conceptuelle relie les termes aux concepts associés qui ne sont pas explicitement énoncés dans les documents les plus pertinents. Sans mots-clés correspondants, des analyses, des discussions et des interprétations dans d’autres documents peuvent nous informer sur ces concepts. Le projet Citation Network exploite le réseau de liens intégrés dans la jurisprudence pour en savoir plus sur ces concepts et améliorer le classement des documents en conséquence.

Prenons l’expression « utilisation équitable Â», par exemple. Les professionnels du droit ont une compréhension générale de la signification de cette expression et de ses implications. Cependant, de nombreuses décisions judiciaires n’incluent pas les mots-clés « utilisation équitable » même si l’utilisation équitable est au cÅ“ur du raisonnement du juge. La recherche conceptuelle relie la notion de traitement équitable à ces cas lorsque d’autres décisions traitant du concept les citent en contexte.

Recherche dans la navigation

La recherche de navigation a été améliorée en associant des termes clés aux documents correspondants. Par exemple, les professionnels du droit savent peut-être que la LPRPDE signifie la Loi sur la protection des renseignements personnels et les documents électroniques. Le moteur de recherche ne l’a pas fait. Jusqu’à récemment, il n’y avait pas de correspondance entre les deux. Lors d’une recherche sur la LPRPDE, vous aviez l’habitude d’obtenir une série de résultats répertoriant uniquement ceux correspondant au terme. Très probablement, il y avait une décision incluant le terme exact mais pas ce à quoi il se réfère, comme celle-ci :

Depuis la mise en œuvre du projet Citation Network, le premier résultat pour la LPRPDE est le document législatif correspondant :

Un lien est maintenant établi entre l’acronyme LPRPDE et ce qu’il signifie réellement. Puisqu’il s’agit d’un modèle d’apprentissage, il s’enrichit et se précise à mesure que des documents juridiques supplémentaires sont publiés.

Améliorations générales des performances

L’apprentissage du réseau de citations améliore également les performances générales du moteur de recherche de Lexum de diverses manières.

Tout d’abord, l’algorithme est bien meilleur pour renvoyer des documents faisant autorité pour des requêtes conceptuelles larges. Pour ce type de requête, le document présenté en tête de liste est le plus souvent parmi les lois pertinentes ou les arrêts les plus cités de la Cour suprême sur le sujet en question.

Ensuite, l’algorithme est également beaucoup plus efficace pour diriger les utilisateurs vers des sections ou des concepts spécifiques qui sont directement liés à une sous-unité législative.

Troisièmement, nous avons observé que les résultats sont cohérents entre les requêtes conceptuelles et les requêtes de navigation qui sont essentiellement identiques. Par exemple, «Charte 2b» et «liberté d’expression» renvoient effectivement les mêmes résultats.

Le projet Citation Network améliore considérablement la pertinence des résultats de recherche. Il fournit un meilleur classement pour les requêtes générales basées sur des sujets, ainsi que pour les requêtes de navigation. De plus, ces améliorations sont obtenues avec des temps de réponse similaires à ce qu’ils étaient auparavant. Et comme il est basé sur un modèle d’apprentissage, plus la base de données est grande, plus les résultats seront précis.