Daniel POULIN
Centre de recherche en droit public
Faculté de droit, Université de Montréal
Cela dit, le plus vert des néophytes aura compris, qu'en ce domaine, même les pionniers de vingt mois d'expérience sont encore, il faut bien l'admettre, en grande partie ignorants et perplexes quant à la forme définitive du cyberespace global de demain et des technologies qui y seront utilisées. Néanmoins, puisqu'au pays des aveugles les borgnes sont rois, nous allons partager immédiatement et sans complexes les premiers résultats de nos tâtonnements. Pour ce faire, nous adopterons le point de vue de celui ou celle qui se prépare à diffuser sur l'Internet.
Pour éclairer les choix de l'éventuel diffuseur, nous aborderons successivement l'établissement des objectifs; le choix du mode de la publication, à l'interne ou à l'externe; le matériel et l'environnement logiciel requis; les considérations à prendre en compte lors de l'élaboration du contenu; le travail de préparation du matériel diffusé et, finalement, le travail de gestion du serveur. Dans une seconde partie, nous décrirons une activité particulière de diffusion, celle des décisions récentes de la Cour suprême du Canada par le CRDP. Ce cas pratique, nous permettra de mettre en évidence certaines des leçons qui se dégagent de nos activités sur l'Internet. Et vous l'aurez deviné, une des plus importantes de celles-ci a trait à l'utilisation du SGML.
L'Internet se prête également bien aux activités de promotion d'une entreprise ou d'une ressource publique. Pensons par exemple, à la promotion d'une destination touristique, à celle des conditions d'études dans une université ou aux conditions d'installation dans un important parc industriel. Certaines formes de publicité, disons "corporatives", peuvent être assimilées à ces promotions. Les descriptions de firmes d'avocats que l'on trouve sur l'Internet sont de ce type. Chaque professionnel y est présenté et l'expertise de la firme y est habilement proposée. Il ne faut pas croire que de telles publicités conduisent directement à de nouveaux mandats. Cependant, le message envoyé est clair : nous sommes là, notre firme est à l'affût des nouvelles technologies et elle sait les utiliser.
Plus incertaine est l'utilisation immédiate de l'Internet pour la conduite d'activités commerciales "grand public". Certaines des toutes premières expériences ont conduit à des déceptions. On ne vend pas facilement des "zirconia cubiques" sur l'Internet. On y trouve probablement plus d'acheteurs de modems, de logiciels, de livres, de CD-ROM que dans la société en général. Il semble donc, qu'à l'étape actuelle, l'Internet n'offre que des possibilités limités pour le petit commerce et celà en autant que l'on tienne compte du type de clientèle qui peut y être rejoint.
Dans ce bref paragraphe, nous n'avons mentionné que les utilisations les plus immédiatement intéressantes de l'Internet aujourd'hui. Cette liste n'est pas exhaustive, bien entendu; cependant, il est fort probable que ceux et celles intéressés par la gestion de la documentation gouvernementale trouveront au sein des objectifs énumérés ceux qu'il convient d'assigner à leur projet de diffusion sur l'Internet.
Un second problème, fort important pour certaines organisation est celui de la sécurité. En effet, de nombreux organismes doivent gérer sur leurs réseaux informatiques de nombreuses informations personnelles, confidentielles ou, tout simplement, "sensibles". Pour ces organisations, rendre public un de leur ordinateurs n'est pas une décision sans conséquences, et cela, même si les techniques pour gérer de façon sécuritaire des réseaux reliés à l'Internet sont de mieux en mieux connues.
Cependant, procéder à l'interne procure des avantages. L'acquisition et le développement de savoir-faire liés à l'exploitation des inforoutes est sans aucun doute le premier bénéfice qui vient à l'esprit. Car, si les inforoutes doivent prendre la place qu'on leur annonce, il faudra bien que nos organisations soient en mesure de les exploiter. Un second bénéfice du développement interne, c'est l'indépendance, l'autonomie. Lorsque le site WWW est chez soi, une mise à jour peut être faite plus simplement. On peut, sans avoir à transiger avec qui que ce soit, modifier le site WWW, sa structure et ses contenus. Cette prise directe sur les contenus diffusés est particulièrement importante parce que l'oeuvre produite n'a pas la stabilité de l'oeuvre papier. Tout au contraire, le contenu informationnel devra être constamment modifié, mis à jour. Ainsi tout développement à l'externe doit être vu dès le départ comme l'établissement d'une relation d'affaire continue.
Cependant, malgré les coûts qu'entraîne l'impartition d'activités à l'externe, nous ne craignons pas de confier à d'autres la préparation des documents papiers destinés à être diffusés largement. Les raisons qui justifient ces choix s'appliquent en bonne partie aux publications électroniques. Car, comme le dit l'adage : "chacun son métier et les vaches seront bien gardées". Ainsi, il est fort possible que les coûts impliqués dans la mise sur pied d'une équipe réunissant les compétences nécessaires à la diffusion du l'Internet soient difficilement justifiables si des entreprises peuvent produire le service de façon plus économique. Le recours à un agent externe solutionne du même coup les problèmes de sécurité de l'organisme.
Les inconvénients de l'impartition des services de diffusion sur l'Internet sont bien entendus les corollaires des avantages de le faire soi-même. Par exemple, le recours à une collaboration externe réduit l'acquisition d'expertise. Toutefois, la principale contrainte qu'amène cette délégation de la publication vient du caractère évolutif de l'ouvrage diffusé. L'expérience montre qu'on ajoute, modifie ou retire régulièrement des pages sur de tels serveurs. Dans ce contexte, les partenaires, l'organisme commanditaire et le diffuseur, doivent maintenir des relations étroites non seulement au moment de la conception du site mais tout au long de son existence.
Pour ceux qui envisagent de mettre en place de nouveaux services et qui s'apprêtent à confier ce mandat à une firme externe, un certain nombre de paramètres doivent être clarifiés au moment de la préparation du contrat. Mentionnons, à titre d'exemples : la procédure d'approbation du graphisme, la possibilité de récupérer les pages développées en fin de contrat, la conception de pages "transportables", la préparation régulière de rapports d'utilisation spécifiques, les délais qui seront nécessaire lors des mises à jour, l'adresse par laquelle le service sera connu sur l'Internet. Chacun de ces aspects peut contribuer à rendre plus intéressante une proposition plus coûteuse mais néanmoins beaucoup plus satisfaisante. Notons enfin, que généralement le coût des contrats de diffusion sur l'Internet sera fonction du nombre et de la difficulté des pages HTML développées et de la durée de leur diffusion.
Cependant des solutions plus économiques s'offrent. Un micro-ordinateur de quelques milliers de dollars doté du système d'exploitation Linux constitue une solution de départ raisonnable à un coût imbattable. C'est d'ailleurs ce qu'ont choisi de faire certaines organisations qui diffusent à travers le monde avec un équipement d'environ 2 000 dollars. Dans un tel scénario, le seul coût réel de diffusion provient des frais mensuels de rattachement à l'Internet.
Comme la diffusion sur l'Internet s'appuie de façon importante sur un foule d'outils développés dans des contextes non commerciaux et mis gracieusement à la disposition de la communauté des utilisateurs de l'Internet, il est souhaitable de retenir une solution informatique qui permettra de puiser à cette abondante source de logiciels publics. C'est le cas pour les versions les plus populaires du système d'exploitation Unix. C'est aussi le cas, mais dans une moindre mesure, pour les systèmes d'exploitation Windows et Macintosh.
L'environnement minimal de programmation se compose du langage de manipulation de texte Perl et de scripts d'interface pour les programmes externes, habituellement appelés CGI scripts (Common Gateway Interface). Le Perl et les scripts CGI vous permettront de mettre en place des formulaires, des compteurs, de faire l'interface avec les éventuels mécanismes de repérage.
De ce côté, de nombreux logiciels gratuits, du moins pour les utilisations non commerciales sont également offerts[4]. Les principaux sont le vénérable WAIS, freeWAIS-sf et Glimpse. Le premier apparaît aujourd'hui fort limité. Par exemple, il ne supporte pas les caractères accentués et il ne permet pas la recherche par champs. Les deux autres sont beaucoup plus sophistiqués et pourront satisfaire la plupart des besoins. Au surplus, plusieurs des logiciels de gestion documentaire que nous connaissons dans les environnements PC font actuellement la migration vers l'Internet. C'est le cas notamment du mécanisme de repérage NQL au coeur du logiciel Naturel de la firme Ardilog.
Reste encore à trouver et installer un ou des logiciels servant à mesurer l'utilisation du site. Ces programmes permettent d'exploiter l'information qu'accumulent les serveurs HTTPd dans leurs fichiers journal. Sans eux, les milliers de pages d'information accumulées par le serveur sont presque inutilisables. Des listes de tels programmes sont également disponibles sur l'Internet[5].
En analysant le contenu à diffuser sur un futur serveur, il ne sert à rien de tout réinventer. Au contraire, l'attitude la plus sage nous semble être d'étudier les publications passées de l'organisation. En effet, si un document à été publié, c'est sans doute que l'on avait identifié un besoin. Sous ce rapport, la conception du site WWW peut être vue comme une mise en valeur du capital-information d'un organisme. Dans tous les projets de diffusion auxquels le CRDP a été mêlé, nous avons trouvé des publications sur papier, généralement peu diffusées, souvent de très bonne qualité, qui ont permis de fournir l'ossature de la présentation de l'organisme et de sa raison d'être. Il en va de même des divers bulletins qui peuvent eux aussi donner lieu à une version électronique complète ou partielle.
La seconde catégorie regroupe ce que l'on n'a pu diffuser auparavant en raison du coût prohibitif de la publication sur papier. On trouve dans cette catégorie divers ouvrages ayant un public plus limité. Il s'agira, par exemple, du résultat d'une recherche bibliographique ou, dans le cas d'un tribunal, des décisions qui n'étaient pas jusqu'à présent retenues pour publication. Notons au passage, que l'économie de la publication électronique se réalisera d'autant mieux qu'il s'agira d'une information assimilable à une collection de documents semblables. Dans de tels cas, les procédures développées pour diffuser le premier de ces documents pourront ensuite être appliquées à tous les autres.
Notre troisième catégorie est celle des publications propres aux nouveaux environnements électroniques. On constate en effet que, en raison de l'exemple fourni par les américains, ou par vanité, on adopte plus facilement le style présidentiel sur l'Internet que dans les publications papiers de nos organismes. On étale ses notes biographiques, on les accompagne de sa photo, tout comme si on était secrétaire au commerce à Washington. Étonnant, mais peut-être néanmoins nécessaire dans un monde d'information virtuel. C'est un peu comme si nous tentions de donner à notre maison électronique tout le relief possible, de façon à ce que nos visiteurs aient quelque chose de tangible à lire, entendre et regarder.
Ces trois catégories nous fournissent amplement de matière pour monter notre serveur. Reste encore à discuter son organisation, sa structure. Notre expérience de concepteur de site et d'utilisateur de l'Internet nous amène à suggérer très fortement la conception de sites bien équilibrés. Il nous semble souhaitable que les diverses sections d'un lieu électronique soient à l'image des chapitres d'un livre bien rédigé, c'est-à-dire, de taille comparable. Sans cela, le visiteur explorera quelques courtes branches, se lassera et négligera de visiter le lien hypertexte qui l'aurait conduit au coeur des contenus diffusés.
Le pire problème - ou le plus amusant, c'est selon le point de vue - est la conception de l'apparence graphique du site. Quelque soit le plaisir que l'on éprouve à être impliqué dans la création d'oeuvre électroniques nouvelles, il faut bien reconnaître qu'il s'agit là d'une activité coûteuse en talent et en temps. Elle nous apparaît toutefois inévitable. Malheureusement, un site sur l'Internet dépourvu d'un graphisme un peu accrocheur peut fort bien passer inaperçu. Il est vrai que certains des meilleurs sites, comme celui du Legal Information Institute (LII), sont d'une grande sobriété. Toutefois, chaque site n'offre pas la richesse documentaire du LII. Disons pour conclure, que pour le meilleur ou pour le pire, du côté graphisme, la barre est actuellement assez haute et que cela n'est pas sans effet sur le coût de mise en place de nos serveurs. Il en va cependant ainsi de tous les médias, nous avons perdu l'habitude des émissions de télévisions toutes croches à la française, où l'on trébuche sur les chaises, comme nous avons perdu celle des magazines sérieux du type Pékin Information.
La publication d'un groupe de décisions débute par l'envoi par modem des décisions depuis la CSC jusqu'à un serveur Sun du CRDP. Leur arrivée déclenche l'envoi d'un message électronique à l'éditeur des serveurs Internet du CRDP. Sur réception du message, l'éditeur lance sur son Macintosh la procédure de traitement automatique des décisions qui comporte elle-même cinq principales étapes[7].
En premier lieu, la procédure établit une connexion FTP pour transférer les fichiers reçus sur le Macintosh. Lorsque les fichiers ont été reçus, la deuxième étape, l'étape de conversion, s'enclenche. Les fichiers originaux de la CSC sont en format WordPerfect #5.1 et les diverses versions diffusées sur nos serveurs doivent être produites sur l'appareil Macintosh. Ces conversions ont été programmées à l'aide d'AppleScript et elles sont lancées par le script général de traitement.
En troisième lieu, lorsque les conversions sont terminées, l'ensemble des fichiers produits, Ms Word 5, ASCII et Ms Word/Binhex et le fichier d'origine WP 5.1, sont retournés vers le serveur Sun. À cette étape, diverses modifications peuvent être apportées au serveur. Par exemple, si l'envoi fait suite à la publication de décisions dans les recueils, le programme se chargera de retirer les anciennes versions des décisions et les remplacera par les nouvelles. De plus, s'il s'agit d'un nouveau volume du recueil, le répertoire approprié sera créé. Alors peut être abordé la quatrième étape, celle démarrant l'indexation sur le Sun avec le programme WAIS. Ce travail permettra de mettre à jour les fichiers de listes inversées nécessaires aux traitement des requêtes des usagers.
La cinquième et dernière étape comprend la génération d'un projet de message pour la liste d'envoi automatique Jurinet-L. Ce projet de message résulte de l'analyse de chacun des nouveaux fichiers afin d'y repérer le nom des arrêts, les termes d'index utilisés par le personnel de la Cour et d'autres informations utiles à la présentation des décisions. Ce projet de message est reçu par l'éditeur, qui, après avoir vérifier les nouveaux fichiers, envoie le message à la liste des abonnés à Jurinet-L. Ce type d'opération est répété à chaque publication de la Cour, soit environ quarante fois par année.
Lorsque le service de diffusion a été conçu au début de 1994, il nous apparaissait tout à fait raisonnable de retenir WP #5.1 comme format de diffusion. C'était le format même utilisé par la Cour et la norme de facto dans le monde juridique. Le Ms Word #5 pour Mac a été ajouté afin d'offrir aux utilisateurs de ce type d'appareil un accès automatique aux décisions[8]. Pour tous les autres, ceux qui n'utilisent pas de micro-ordinateurs ou qui auraient des difficultés avec les versions Word et WordPerfect, nous avions décidé d'offrir la version ASCII. Cependant, ce format ASCII, le plus bas commun dénominateur, ne pouvait en aucune façon suffire, ne serait-ce que parce qu'il ne permettait pas l'expression des caractères accentués. Toutefois, dans leur ensemble, ces formats complémentaires nous apparaissaient satisfaisants.
À peine un an plus tard, le personnel de la Cour nous a contacté pour nous prévenir qu'ils adopteraient très bientôt un nouveau logiciel de traitement de texte, Ms Word #6 pour Windows ou WordPerfect #6 pour Windows. Pour l'équipe du CRDP, l'adoption de ce nouveau format ajouterait une conversion de plus; rien là de catastrophique. Cependant, la tournure des évènements commencait à nous déplaire. Dorénavant, quelque soit le logiciel retenu par la Cour, la version originale ne serait plus disponible sur nos serveurs.
Mais il y avait pire. Quelque soit l'angle sous lequel on prenne le problème, tôt ou tard, l'ensemble de nos utilisateurs adopteraient les versions plus récentes des traitements de texte les plus populaires, rendant nos conversions vers les formats obsolètes tout à fait contre-productives. Il nous faudrait donc modifier tôt ou tard nos formats de diffusion pour adopter quelque chose comme : ASCII, WP #6 et MS Word #6. Mais alors, que faire des décisions passées? Les laisser dans leurs formats disparus? Les convertir vers les nouveaux formats à la mode? Une solution ou l'autre comportait des problèmes. Pire, même si nous adoptions la seconde hypothèse, avec les coûts qu'elle comporte, le problème ne serait réglé que jusqu'à la parution de nouvelles version des logiciels de traitement de texte. Microsoft a alors commencé à annoncé le Ms Word #7. Nous étions bel et bien empêtrés dans les formats "propriétaires".
C'est face à tout cela que nous avons choisi d'orienter nos investissements vers un format de fichier susceptible de durer. Un format qui ne dépende pas des impératifs de marketing d'une firme commerciale. Ce format existe, il est disponible, c'est le SGML. Nous nous sommes d'autant plus facilement convaincus de nous tourner vers le SGML que d'autres facteurs nous pressaient dans ce sens.
Encore une fois, la solution à nos difficultés semblait passer par le SGML. En effet, c'est précisément un des avantages du SGML que de permettre l'expression de la structure des documents. Une fois la structure adéquatement balisé avec le SGML, il devient possible d'utiliser des mécanismes de repérage extrêmement précis, comme le NQL d'Ardilog.