Numérisation et traitement des décisions pour la Fondation du droit de Terre-Neuve-et-Labrador

La Fondation du droit de Terre-Neuve-et-Labrador a fourni le financement nécessaire pour que les décisions judiciaires historiques de cette province rendues avant 2003 soient mises à disposition gratuitement sur le site Web de CanLII. Lexum a identifié les décisions, les a numérisées, a généré une version en format de traitement de texte, les a converties au format HTML et PDF, et finalement les a publiées en ligne sur CanLII.

Le défis

La Fondation du droit de Terre-Neuve-et-Labrador offre des subventions pour faire avancer la compréhension du droit par le public et améliorer l’accès aux services juridiques. La Fondation a accordé une subvention à CanLII pour améliorer l’accès aux décisions judiciaires datant d’avant 2003 qui n’étaient jusque-là disponibles que dans les rapports imprimés de jurisprudence. La création en grande quantité de ressources numériques provenant de documents papier implique un certain niveau de complexité. Dans ce projet, pour chacune des décisions, les sources ont dû être identifiées, numérisées, traitées et diffusées sur CanLII. Face à ce défi, Lexum a su identifier et réaliser une solution pragmatique et économique.

La solution

Comme étape préliminaire, la liste des décisions à traiter a été identifiée en interrogeant le citateur de CanLII et en isolant les décisions qui n’avaient pas encore été diffusées sur le site web. La prochaine étape a été de localiser la source idéale pour chaque décision afin de constituer la base des données numériques. Les décisions ont été numérisées individuellement à partir de dizaines de volumes empruntés dans des bibliothèques de droit, ainsi que depuis les archives de jurisprudence canadienne accumulées par Lexum au fil des ans. Un processus de contrôle de qualité approfondi a été effectué sur les images numérisées, chacune d’elle étant vérifiée afin d’identifier toute page manquante.

Les images PDF ont ensuite été converties en texte numérique à l’aide d’outil de reconnaissance optique de caractères (ROC). Après avoir fait une relecture complète afin d’éliminer les fautes de frappe et d’orthographe, le contenu des décisions a été formaté à l’aide d’un modèle Microsoft Word spécialement conçu à cette fin. Le contenu propriétaire figurant dans les rapports imprimés, tels que les résumés, sommaires, notes de l’éditeur, et les en-têtes  / pieds de page ont été omis dans les fichiers Word. Seuls les motifs des décisions ont été retenus. Le nom de la cour, de la décision, la citation neutre, la date ainsi que le numéro de dossier ont été extraits et formatés. Des styles Word ont été appliqués à différentes parties du texte afin de mieux contrôler l’aspect visuel des documents. La numérotation des paragraphes a également été ajoutée là où il n’y en avait pas. Les fichiers ont ensuite fait l’objet d’un dernier contrôle de qualité afin de vérifier si des erreurs s’étaient glissées dans le texte ou les métadonnées.

Enfin, la dernière étape du projet a été la publication du nouveau contenu sur le site web de CanLII. Au cours des dernières années, plus de 40 000 pages ou 4 600 décisions ont été numérisées de cette manière. Cette opération a accru de 16 ans (de 1987 à 2003) la couverture exhaustive de CanLII pour les cours supérieures de Terre-Neuve-et-Labrador. Les informations de citations ont été mises à jour en conséquence et une vérification de l’historique judiciaire a été effectuée sur les bases de données de la Cour d’appel de Terre-Neuve-et-Labrador, de sorte que toutes les associations possibles ont pu être faites entre les décisions de première instance et d’appel.

https://www.canlii.org/fr/nl/