Solex: le tout nouveau moteur de recherche de Lexum

Dans le film L’homme au pistolet d’or, le Solex est un dispositif révolutionnaire destiné à résoudre la crise énergétique de 1973. Après avoir tué son inventeur britannique, un assassin d’élite vole le Solex pour le vendre à des puissances étrangères. James Bond est envoyé pour trouver l’assassin et récupérer le précieux appareil. Parce que c’est un film de James Bond, il y a aussi un laser.

L’agitateur Solex

Solex est également synonyme de plugins SolrCloud Lexum, la toute dernière version du moteur de recherche intégré par Lexum à tous ses produits.

Lexum a utilisé une grande variété de moteurs de recherche au fil du temps. Tout a commencé à l’aube du Web, en 1994, avec le Wide Area Information Server (WAIS). Puis est venu le moteur de recherche NQL d’une entreprise locale de Montréal. Ensuite, pendant un an environ, le moteur de recherche SINO d’AustLII. En 2003, nous avons choisi de créer notre propre moteur de recherche: Eliisa, une bibliothèque rapide et plus performante basée sur le moteur de recherche Apache Lucene. Enfin, en 2009, nous avons intégré les éléments Apache Solr à Eliisa et l’avons transformé en une application serveur autonome.

Aujourd’hui, nous sommes heureux d’annoncer la venue de notre moteur de recherche de 3ème génération: Solex.

Au fil des ans, nous avons ajouté un certain nombre de fonctionnalités aux plateformes de recherche Apache Lucene / Solr: la génération plus rapide d’extraits, l’amélioration des performances des requêtes, la mise en évidence des termes dans l’intégralité des documents, des opérateurs de proximité par phrase et paragraphe, un mécanisme d’auto-complétion intelligent des numéros de dossiers, un analyseur de requête indulgent avec une syntaxe personnalisée, l’indexation tenant compte du HTML, l’indexation et la mise en surbrillance des citations juridiques, les fonctionnalités de compilation des suivis, et bien plus encore.

Alors, quelles nouvelles fonctionnalités apporte Solex? La réponse est l’évolutivité, l’amélioration des performances et la flexibilité.

Au cours des quinze dernières années, Lexum a été fier de fournir à CanLII le moteur de recherche juridique le plus rapide au Canada. La croissance du contenu et du trafic a cependant rendu ce haut niveau de performance plus difficile à maintenir. De nos jours, CanLII indexe plusieurs milliards de mots et gère en moyenne quinze requêtes par seconde, avec de fréquents pics de 50 requêtes ou plus par seconde. En bref, notre moteur de recherche précédent avait atteint la limite de ce qui pouvait être fait dans un processus à serveur unique. Solex, notre nouveau moteur de recherche, est basé sur Apache SolrCloud, une technologie utilisée par Netflix, Instagram, Reddit et d’autres géants de l’Internet pour leurs propres plateformes de recherche. Solex évolue horizontalement en distribuant le contenu et les requêtes à autant de serveurs que nécessaire. En conséquence, le temps de réponse est meilleur et plus cohérent, apportant jusqu’à 500% d’accélération pour certaines requêtes, guarantissant aux usagers des produits de Lexum qu’ils bénéficieront du meilleur temps de réponse pour encore de nombreuses années.

Bien que Solex améliore modestement la précision de classement des résultats du Top-3 de 4% par rapport à notre moteur de la génération précédente, le meilleur reste à venir. Un paradigme distribué nous donne la flexibilité d’expérimenter avec de nouveaux algorithmes de classement basés sur l’apprentissage machine qui sont plus gourmands en processeurs, et nous donnent bon espoir d’améliorer les mesures de pertinence à l’intérieur de tous nos produits, ainsi que d’offrir une expérience encore meilleure à chaque utilisateur.

Solex a été déployé sur CanLII le lundi 20 février 2018 et sera déployé à l’intérieur de nos autres produits au cours des prochaines semaines.

Si notre Solex pourrait ne pas résoudre la prochaine crise énergétique, nous espérons qu’il trouvera une solution à votre prochaine recherche juridique.