En vue de maîtriser l'information dans une organisation, il faut donc aujourd'hui s'attaquer au vaste domaine des documents. Il est devenu vital d'apprendre à modéliser les documents en tant que contenants structurés dans lesquels le contenu se trouve inséré entre des balises qui délimitent des éléments logiques définis. La figure 1 illustre le besoin de modéliser l'information des documents comme celles des données conventionnelles. On notera la place particulière qu'occupent les formulaires complétés: des hybrides dotés à la fois de caractéristiques des transactions (données) et des caractéristiques de documents.
FIGURE 1 (voir page suivante)
À l'heure où l'informatique orientée réseau pousse à décloisonner la modélisation des données entre les divisions d'une organisation et entre les organisations, il importe de recourir aux techniques de référentiels et autres services communs aux applications. Àcette fin, il faut étendre et généraliser le savoir-faire en analyse, en modélisation et en gestion des textes et des documents et faciliter l'accès aux logiciels et aux ressources en réseau. L'apport de cette modélisation des documents se base de plus en plus sur un langage commun : SGML.
Ce marquage normalisé représente un potentiel intéressant pour apporter une solution à l'intégration des fonctions applicables aux documents. C'est ce qu'offre la norme SGML.
Bien que les administrations publiques soient peu avancées en cette matière, l'apport de SGML est prometteur pour modéliser les connaissances qui se trouvent dans des types de documents comme les lois, les règlements, les directives, les manuels de procédures, d'interprétation ou d'application, les répertoires, les grandes séries de notes, d'analyses, de lettres, etc.
Un facteur important d'adoption de cette norme est que les producteurs de logiciels offrent une gamme de produits où SGML constitue un format possible en intrant comme en extrant : c'est le cas de Wordperfect (Novell) et de Word (Microsoft). En outre, les SGBD dits "serveurs SGML" se multiplient et, de plus en plus, sont orientés objet en raison du fait que tout élément logique d'un document est assimilable à un objet.
Le facteur le plus décisif et le plus porteur d'avenir favorisant l'adoption de SGML vient de l'immense succès de l'Internet et du World Wide Web, où tous les documents sont marqués en HTML (Hypertext Mark-up Language). HTML est une définition de type de document conforme à la norme SGML, tout en constituant une extension de celle-ci pour les liens entre documents grâce à cette autre création du Web que sont les URL (Uniform Resource Locator), qui permettent la navigation hypertexte entre les milliers de sites Web et les millions de documents qui y sont rendus accessibles. Des logiciels du domaine public comme Mosaic ou Netscape offrent une interface d'utilisateur capable de consulter tout document HTML (et même tout document SGML depuis l'ajout de la composante Panorama dans Mosaic).
L'importance ainsi prise par la norme SGML sur le Web viendra stimuler encore plus l'activité intense d'élaboration de normes complémentaires (pour l'hypermédia, pour la composition automatique, pour les imprimantes, ainsi que pour de grands types de documents courants).
. diminution du risque de désuétude des données représentées de façon indépendante des outils de traitement;
. augmentation de la qualité des documents produits et imprimés ou affichés à l'écran; flexibilité pour changer la structure ou le format de présentation;
. réduction des coûts de publication, de mise à jour, de diffusion;
. valeur ajoutée à l'information, ce qui la rend beaucoup plus utilisable, propice au partage et à la réutilisation;
. contrôle sur les documents qui se trouvent au coeur des situations de tâches en chaîne ("workflow"), maîtrise de l'intégrité, cohérence d'ensemble améliorée.
Dans l'administration publique, les connaissances d'une organisation se trouvent en grande partie dans les textes: lois, règlements, directives, manuels de procédures, d'interprétation ou d'application, répertoires les plus divers, des séries de centaines ou de milliers de notes, lettres, analyses, etc. La gestion électronique des documents et de l'information textuelle offre des voies de solution sous forme de normes, de protocoles, de méthodes et d'outils.
- à la SAAQ, le Code de la sécurité routière (et ses quelque trente règlements d'application) a été modélisé au moyen d'une DTD en organisant du même coup un Répertoire des infractions (préparé au MJQ et rendu accessible par la SAAQ) et avec des provisions pour que les municipalités puissent y ajouter la réglementation municipale avant que le tout vienne s'intégrer aux outils informatisés déployés dans les corps de police municipaux et de la Sûreté du Québec. Enfin il se pourrait que la SAAQ vise à modéliser également certaines parties d'autres lois que les policiers s'occupant de sécurité routière ont aussi à faire respecter, ce qui est le cas de dispositions de l'Environnement et du Revenu.
-à la RRQ, la forme du problème est semblable; trois lois accompagnées d'un Répertoire et de Guides d'interprétation et d'application sont en cours de modélisation en vue d'y favoriser les besoins constants de repérage par quelques 300 agents de rentes qui font du renseignement téléphonique. Comme à la SAAQ d'ailleurs, les besoins de production et de mise à jour des documents sont pris en compte, quoique le choix entre le dernier Wordperfect ou Word et un logiciel spécialisé comme Author-Editor reste à établir aux deux endroits. La livraison sera faite en avril sur le logiciel Édibase pour SGML.
D'autres applications moins élaborées ont aussi été réalisées:
- la Banque de terminologie du Québec est offerte en SGML sur CD- ROM;
- la Bibliothèque Nationale du Québec offre un CD-ROM de références bibliographiques et une banque d'appellations;
- la Commission d'accès en matière de lésions professionnelles a une banque de sa jurisprudence emmagasinée avec SGML.
- tous les documents rendus disponibles sur le Web (de l'Internet) sont en HTML (écrit en SGML): MAPAQ, Ass. Nat., MCCQ, SCT...
- Le projet présenté par le CRISP de carte multi-services peut se traduire techniquement par une modélisation unifiée de l'information contenue dans un nombre substantiel de documents dans plusieurs secteurs, ce qui pourrait profiter du recours à SGML. L'utilisation d'une carte suppose une modélisation unifiée des renseignements d'identification des citoyens et des entreprises communiquant avec l'État.
D'un point de vue général, la plupart des documents qui circulent dans l'Administration relèvent de trois grandes classes de documents:
- juridique: lois, règlements, directives, politiques, manuels d'interprétation et d'application (ces derniers sont hybrides avec la classe suivante, le RPG en constituant peut-être un exemple);
- administratif: mémoires, analyses, notes de service ou mémos, lettres d'affaires, renseignements complétés dans un formulaire (le Plan triennal en ressources informationnelles en constitue un exemple en partie hybride avec la classe suivante);
- technique: documentation des systèmes informatiques, fabrication de formulaires électroniques, manuels techniques d'entretien et réparation, catalogues, fiches terminologiques, références bibliographiques, etc.
Ce premier classement de documents ne vise pas à forcer des cloisonnements, mais à effectuer des regroupements utiles en vue de faciliter à la fois l'interopérabilité, l'échange concerté et la réutilisation des concepts, des méthodes et des outils. En effet, l'approche SGML passe par l'établissement de conventions d'application; il faut donc qu'il y ait eu accord entre les parties à l'échange.
La classe juridique de documents est proposée comme secteur prioritaire d'intervention en raison de sa portée éventuelle dans chacun des ministères et organismes de l'Administration; le milieu juridique paraît aussi plus limité et donc plus facile à concerter; mais surtout, c'est avec des documents juridiques qu'ont été réalisées les premières applications les plus significatives dans l'administration publique québécoise : le savoir-faire qui y a été développé offre le meilleur potentiel de réutilisation.
La figure 2 (voir page suivante) situe les grandes lignes du travail à faire dans le domaine juridique qui se situe d'une part dans une modélisation générique des liens intra-loi et inter-lois, des liens entre loi et règlement, puis de ceux-ci avec les manuels d'interprétation et d'application pour obtenir des façons de concevoir, structurer et travailler avec la documentation juridique pouvant servir dans tout secteur de la législation québécoise. C'est l'aspect modélisation des documents.
L'aspect soutien du processus de la figure 2 situe d'autre part le travail à faire au niveau du cycle de vie du document de façon à ne pas limiter la modélisation des documents à un état achevé, mais àsoutenir une représentation évolutive du document dans une chaîne éditoriale partant de la rédaction, via les révisions et la sanction jusqu'à la diffusion, la consultation. Il faut étudier le processus au complet.
La façon de procéder devrait être la formation d'un groupe de travail interministériel de spécialistes de l'informatique et en gestion des documents et de l'information textuelle ainsi que de tout contenu concernant des éléments logiques définis comme pertinents dans la modélisation SGML (les apports de la technologie du référentiel seront recherchés).
Ce groupe s'associerait avec des experts du secteur privé pour élaborer une stratégie appropriée au contexte technologique et organisationnel de l'Administration et aux volontés de changement. Le caractère pragmatique de cette stratégie est important.
Les questions suivantes devraient être traitées:
- Expliquer la place de SGML en gestion des documents et ses principaux bénéfices pour un ministère particulier et pour l'ensemble du gouvernement; tracer les grandes lignes d'une démarche pour son implantation ou déploiement dans l'Administration en lui dessinant une place dans l'architecture gouvernementale en technologies de l'information.
- Identifier les éléments d'un système SGML y compris en rapport avec Wordperfect, le Web et les autres composantes techniques; analyser les questions relatives au français, suggérer des formats d'en-tête et d'autres volets de description et de référence, proposer des mécanismes pour un Répertoire des DTD à l'usage de l'Administration ainsi que dans un ministère, évaluer les DTD publiques les plus intéressantes à réutiliser avec ou sans adaptation dans l'Administration, et décrire les services communs aux applications à développer.
- Expliquer la façon dont on peut mener une analyse de documents et la constitution d'un groupe affinitaire pour l'établissement de conventions d'application dans un domaine: analyser les applications potentielles comme SIGA et la carte multi-services.
- Procéder à une première identification des domaines les plus opportuns pour les efforts interministériels.
- Établir la position actuelle de SGML et normes associées dans le marché international et lister les principaux points de vulnérabilité dans un horizon de quelques années.
- Explorer les besoins de DTD pour la classe des documents administratifs.
- Explorer les complémentarités de concepts, méthodes et outils entre SGML, Hytime et DSSSL.
- Produire un Guide explicitant la méthodologie d'analyse des documents, de leur circulation et des activités qui y sont reliées.
- Mener une étude sur les capacités relatives à la modélisation des formulaires sur le Web et à l'enregistrement des renseignements de formulaires complétés dans les SGBD.
- Établir une première cible réalisable de francisation de SGML et documentation nécessaire, en partenariat francophone
FIGURE 3 (voir page suivante)
Dans le tableau qui suit sont fournis des éléments de définition et des exemples pour les trois classes de services et pour les applications. À noter qu'il s'agit d'une synthèse personnelle de l'auteur et non pas d'une position de l'organisme qui l'emploie.
. des procédures de réseau :
- messagerie et transport (TCP/IP, HTTP, SMTP...)
- interfaces (Mosaic, Netscape, Windows)
- référence (liens)
- archivage (en-tête)
- sécurité (contrôle d'accès, identification et authentification, confidentialité des données, intégrité des données, non répudiation).
. des objets d'information :
- référentiel pivot
- modèles de classes de documents et dépôts des instances de documents
- modèles de données et banques
- répertoires de termes et de noms propres
- listes, catalogues, registres.
Le développement de services communs de domaine juridique dépend de l'élaboration concertée de conventions d'application pour le Québec sur des choses comme :
. des modèles de document (loi, règlement, jugement)
. des spécifications aux interfaces de production et de consultation
. un thésaurus juridique québécois
. des glossaires de spécialités du droit
. des spécifications pour l'impression et l'affichage des grandes classes de documents
Ces services communs sont développés en fonction d'une politique interne et de procédures établies et grâce à la l'élaboration de conventions d'applications internes. Ces services pourraient par exemple se préoccuper de :
. la spécification des services communs généraux et de domaine
. la création d'hyperdocuments juridiques et autres relativement à sa mission
. les règles de gestion de la circulation et de l'archivage de son information
Recours aux services communs en vue de supporter les activités de gestion des documents ou de tout autre objet d'information en regard de la mission et des objectifs d'une organisation. Par exemple, dans le domaine juridique:
. élaboration des règles (par exemple : préparation d'un projet de loi, révisions, adoption, diffusion)
. application des règles (par exemple : émission d'un billet pour infraction routière, compléter un rapport d'impôt)
. connaissance des règles (par exemple : consultation des textes juridiques et de la jurisprudence).
Le langage et les outils SGML deviennent donc un élément stratégique en vue de l'élaboration de services communs aux applications : en offrant un contrôle logique ajustable du contenu des documents, SGML se situe au coeur des architectures de gestion de l'information de demain. En effet, les utilisateurs disposent ainsi de "poignées" pour contrôler la circulation et l'utilisation des documents vus comme des objets se comportant selon certaines règles, dans un domaine d'information et un contexte organisationnel donnés. Il y a peu de doute qu'en raison de la valeur informationnelle des documents, le langage SGML est appelé à devenir l'un des principaux outils de modélisation de l'information dans les organisations.
La multiplication des perspectives expertes sur SGML est à favoriser eu égard àl'importance que le phénomène SGML a pris suite à son adoption pour les documents diffusés sur le Web. Le moment est critique pour une action stratégique avec un langage qui permet de modéliser documents et information en un sens plus abstrait.