table des 
matières  
précédente  
suivante  [CRDP]  [Info]  [Help]

ENJEUX ACTUELS EN GESTION DOCUMENTAIRE
AU GOUVERNEMENT DU QUÉBEC

Richard PARENT
Service de la prospective et de la francisation
Secrétariat du Conseil du trésor

INTRODUCTION

Au moment où l'Administration se retrouve plus que jamais confrontée à la vitesse du changement des technologies de l'information et à l'émergence des inforoutes, il est opportun de tenter de comprendre ce changement. L'émergence du document en informatique en est une des composantes les plus importantes. C'est ce que ce texte propose en expliquant d'abord comment SGML se situe dans le cadre de la gestion des documents et de l'information textuelle (Pourquoi SGML?), et en quoi SGML peut contribuer aux exigences croissantes d'une modélisation de l'information àl'échelle de la communication inter-organisationnelle. Le cas du domaine juridique retiendra particulièrement l'attention. Nous présenterons ensuite quelques applications existantes et potentielles, et la place possible de SGML dans les préoccupations de normalisation et de concertation. Une troisième partie présente quelques pistes d'action à entreprendre à court terme et propose une façon globale de voir à plus long terme l'architecture des technologies de l'information.

1- POURQUOI SGML?

Problèmes à résoudre

Malgré quelques progrès récents, il faut déplorer que la masse d'information produite par traitement de texte reste faiblement gérée, peu navigable, sous-exploitée, entièrement laissée au libre arbitre de chacun. Même si une version électronique des documents existe, la très vaste majorité des activités administratives reposent sur le papier pour la circulation, la consultation et la conservation des documents qui les sous-tendent. Mais une grande vague de changements se prépare avec des logiciels d'emmagasinage et de repérage, des langages nouveaux pour la représentation de la forme et du contenu des documents et des textes, ainsi que pour leur traitement, leur affichage et leur transmission dans une nouvelle informatique orientée réseau ("network centric"). Cette modélisation devrait pouvoir aussi répondre aux besoins de ces situations où les documents sont au coeur du travail dans les bureaux : tâches en chaîne ("workflow"), travail d'équipe ("groupware") et commerce électronique (catalogue, formulaire, EDI, acheminement, signature, etc.) qui sont, en fait, diverses façons de travailler avec les documents.

En vue de maîtriser l'information dans une organisation, il faut donc aujourd'hui s'attaquer au vaste domaine des documents. Il est devenu vital d'apprendre à modéliser les documents en tant que contenants structurés dans lesquels le contenu se trouve inséré entre des balises qui délimitent des éléments logiques définis. La figure 1 illustre le besoin de modéliser l'information des documents comme celles des données conventionnelles. On notera la place particulière qu'occupent les formulaires complétés: des hybrides dotés à la fois de caractéristiques des transactions (données) et des caractéristiques de documents.

FIGURE 1 (voir page suivante)

À l'heure où l'informatique orientée réseau pousse à décloisonner la modélisation des données entre les divisions d'une organisation et entre les organisations, il importe de recourir aux techniques de référentiels et autres services communs aux applications. Àcette fin, il faut étendre et généraliser le savoir-faire en analyse, en modélisation et en gestion des textes et des documents et faciliter l'accès aux logiciels et aux ressources en réseau. L'apport de cette modélisation des documents se base de plus en plus sur un langage commun : SGML.

Marquer les documents avec SGML

SGML ("Standard Generalized Mark-up Language") est un langage qui normalise le dépôt de marques, de points de repère dans les documents électroniques (y compris les données textuelles et toute autre forme de données). Ce processus intéresse toutes les fonctions de traitement des données documentaires et textuelles : saisie, échange, emmagasinage et repérage, analyse, catégorisation et annotation. Des marques communes de balisage permettent non seulement de déterminer indirectement l'édition physique d'un document sur papier ou à l'écran, mais surtout de déterminer directement la structure logique du document (sections, figures, renvois, index) et ses autres éléments logiques (variables, noms). C'est l'analyse des documents et de leur utilisation dans une organisation qui conduit à identifier les grands types de documents et leurs principaux éléments à définir : des DTD (définitions de types de documents) sont bâties puis intégrées aux outils d'édition, d'analyse, de validation, etc. du système SGML.

Ce marquage normalisé représente un potentiel intéressant pour apporter une solution à l'intégration des fonctions applicables aux documents. C'est ce qu'offre la norme SGML.

Le potentiel d'utilisation

Bien qu'existant depuis 1986 en tant que norme ISO (8879), SGML a mis un certain temps à voir son utilisation se généraliser, du moins en dehors de l'industrie de l'édition. Depuis deux ans cependant, de nombreux secteurs industriels l'ont adoptée pour leur documentation: secteur militaire, énergie, finances, micro-électronique, informatique, télécommunication, industrie pharmaceutique, aéronautique, automobile, agences de presse, etc. L'échange de documents au sein des filières industrielles s'en trouve réalisé à bien moindre coût.

Bien que les administrations publiques soient peu avancées en cette matière, l'apport de SGML est prometteur pour modéliser les connaissances qui se trouvent dans des types de documents comme les lois, les règlements, les directives, les manuels de procédures, d'interprétation ou d'application, les répertoires, les grandes séries de notes, d'analyses, de lettres, etc.

Un facteur important d'adoption de cette norme est que les producteurs de logiciels offrent une gamme de produits où SGML constitue un format possible en intrant comme en extrant : c'est le cas de Wordperfect (Novell) et de Word (Microsoft). En outre, les SGBD dits "serveurs SGML" se multiplient et, de plus en plus, sont orientés objet en raison du fait que tout élément logique d'un document est assimilable à un objet.

Le facteur le plus décisif et le plus porteur d'avenir favorisant l'adoption de SGML vient de l'immense succès de l'Internet et du World Wide Web, où tous les documents sont marqués en HTML (Hypertext Mark-up Language). HTML est une définition de type de document conforme à la norme SGML, tout en constituant une extension de celle-ci pour les liens entre documents grâce à cette autre création du Web que sont les URL (Uniform Resource Locator), qui permettent la navigation hypertexte entre les milliers de sites Web et les millions de documents qui y sont rendus accessibles. Des logiciels du domaine public comme Mosaic ou Netscape offrent une interface d'utilisateur capable de consulter tout document HTML (et même tout document SGML depuis l'ajout de la composante Panorama dans Mosaic).

L'importance ainsi prise par la norme SGML sur le Web viendra stimuler encore plus l'activité intense d'élaboration de normes complémentaires (pour l'hypermédia, pour la composition automatique, pour les imprimantes, ainsi que pour de grands types de documents courants).

Les bénéfices attendus

Une telle démarche de normalisation des formats de document apportera aux organisations plusieurs avantages significatifs :

. diminution du risque de désuétude des données représentées de façon indépendante des outils de traitement;

. augmentation de la qualité des documents produits et imprimés ou affichés à l'écran; flexibilité pour changer la structure ou le format de présentation;

. réduction des coûts de publication, de mise à jour, de diffusion;

. valeur ajoutée à l'information, ce qui la rend beaucoup plus utilisable, propice au partage et à la réutilisation;

. contrôle sur les documents qui se trouvent au coeur des situations de tâches en chaîne ("workflow"), maîtrise de l'intégrité, cohérence d'ensemble améliorée.

Dans l'administration publique, les connaissances d'une organisation se trouvent en grande partie dans les textes: lois, règlements, directives, manuels de procédures, d'interprétation ou d'application, répertoires les plus divers, des séries de centaines ou de milliers de notes, lettres, analyses, etc. La gestion électronique des documents et de l'information textuelle offre des voies de solution sous forme de normes, de protocoles, de méthodes et d'outils.

2- ÉTAT DE SITUATION

Applications existantes

Les applications les plus significatives de SGML dans l'Administration sont dans le domaine juridique:

- à la SAAQ, le Code de la sécurité routière (et ses quelque trente règlements d'application) a été modélisé au moyen d'une DTD en organisant du même coup un Répertoire des infractions (préparé au MJQ et rendu accessible par la SAAQ) et avec des provisions pour que les municipalités puissent y ajouter la réglementation municipale avant que le tout vienne s'intégrer aux outils informatisés déployés dans les corps de police municipaux et de la Sûreté du Québec. Enfin il se pourrait que la SAAQ vise à modéliser également certaines parties d'autres lois que les policiers s'occupant de sécurité routière ont aussi à faire respecter, ce qui est le cas de dispositions de l'Environnement et du Revenu.

-à la RRQ, la forme du problème est semblable; trois lois accompagnées d'un Répertoire et de Guides d'interprétation et d'application sont en cours de modélisation en vue d'y favoriser les besoins constants de repérage par quelques 300 agents de rentes qui font du renseignement téléphonique. Comme à la SAAQ d'ailleurs, les besoins de production et de mise à jour des documents sont pris en compte, quoique le choix entre le dernier Wordperfect ou Word et un logiciel spécialisé comme Author-Editor reste à établir aux deux endroits. La livraison sera faite en avril sur le logiciel Édibase pour SGML.

D'autres applications moins élaborées ont aussi été réalisées:

- la Banque de terminologie du Québec est offerte en SGML sur CD- ROM;

- la Bibliothèque Nationale du Québec offre un CD-ROM de références bibliographiques et une banque d'appellations;

- la Commission d'accès en matière de lésions professionnelles a une banque de sa jurisprudence emmagasinée avec SGML.

- tous les documents rendus disponibles sur le Web (de l'Internet) sont en HTML (écrit en SGML): MAPAQ, Ass. Nat., MCCQ, SCT...

Quelques applications potentielles

- Le projet SIGA (Système d'information sur la gestion des acquisitions) pourrait avantageusement prendre appui sur une modélisation SGML des documents de référence, des catalogues et des messages EDI de cette forme du commerce électronique.

- Le projet présenté par le CRISP de carte multi-services peut se traduire techniquement par une modélisation unifiée de l'information contenue dans un nombre substantiel de documents dans plusieurs secteurs, ce qui pourrait profiter du recours à SGML. L'utilisation d'une carte suppose une modélisation unifiée des renseignements d'identification des citoyens et des entreprises communiquant avec l'État.

3- PISTES D'ACTION à COURT TERME

Le langage normalisé qu'est SGML possède des caractéristiques qui en font une des clés-maîtresses pour les grands travaux de réingénierie à venir des systèmes d'information dans l'administration publique québécoise: les applications pouvant potentiellement en tirer partie, comme SIGA et la carte multi-services déjà cités, sont des projets prometteurs et de grande envergure. Il se trouve plusieurs autres voies d'action qui, tout en permettant l'atteinte de bénéfices plus immédiats dans des applications de moindre envergure, se situent sur le chemin de l'apprentissage de SGML et demandent une accommodation à de nouvelles façons plus collaboratives de concevoir la gestion des ressources informationnelles.

Sensibilisation et formation

La connaissance de SGML est requise chez un certain nombre de développeurs de systèmes: informaticiens, spécialistes en sciences de l'information, concepteurs de systèmes d'information, etc. Il faut un certain nombre se spécialistes et un plus grand nombre d'initiés. Les moyens envisagés sont des démonstrations d'applications et de logiciels à la Vitrine, des cours offerts par une entreprise privée, une concertation possible avec l'Université, un réseau d'information et d'échange sur le Web. Il est envisagé d'utiliser ce moyen pour donner accès à des Guides appropriés ainsi que pour pointer sur les sources Web pertinentes à SGML, autres normes, méthodologies et outils qui lui sont associés.

Développement de DTD

En SGML, les DTD (Définitions de types de documents) sont le moyen de représenter les modèles de documents, de quels éléments ils sont composés, comment les éléments sont-ils arrangés ou structurés, ceux qui sont obligatoires ou facultatifs, etc. Il faut pouvoir utiliser des DTD correspondant à nos besoins. Que faut-il choisir pour commencer?

D'un point de vue général, la plupart des documents qui circulent dans l'Administration relèvent de trois grandes classes de documents:

- juridique: lois, règlements, directives, politiques, manuels d'interprétation et d'application (ces derniers sont hybrides avec la classe suivante, le RPG en constituant peut-être un exemple);

- administratif: mémoires, analyses, notes de service ou mémos, lettres d'affaires, renseignements complétés dans un formulaire (le Plan triennal en ressources informationnelles en constitue un exemple en partie hybride avec la classe suivante);

- technique: documentation des systèmes informatiques, fabrication de formulaires électroniques, manuels techniques d'entretien et réparation, catalogues, fiches terminologiques, références bibliographiques, etc.

Ce premier classement de documents ne vise pas à forcer des cloisonnements, mais à effectuer des regroupements utiles en vue de faciliter à la fois l'interopérabilité, l'échange concerté et la réutilisation des concepts, des méthodes et des outils. En effet, l'approche SGML passe par l'établissement de conventions d'application; il faut donc qu'il y ait eu accord entre les parties à l'échange.

La classe juridique de documents est proposée comme secteur prioritaire d'intervention en raison de sa portée éventuelle dans chacun des ministères et organismes de l'Administration; le milieu juridique paraît aussi plus limité et donc plus facile à concerter; mais surtout, c'est avec des documents juridiques qu'ont été réalisées les premières applications les plus significatives dans l'administration publique québécoise : le savoir-faire qui y a été développé offre le meilleur potentiel de réutilisation.

La figure 2 (voir page suivante) situe les grandes lignes du travail à faire dans le domaine juridique qui se situe d'une part dans une modélisation générique des liens intra-loi et inter-lois, des liens entre loi et règlement, puis de ceux-ci avec les manuels d'interprétation et d'application pour obtenir des façons de concevoir, structurer et travailler avec la documentation juridique pouvant servir dans tout secteur de la législation québécoise. C'est l'aspect modélisation des documents.

L'aspect soutien du processus de la figure 2 situe d'autre part le travail à faire au niveau du cycle de vie du document de façon à ne pas limiter la modélisation des documents à un état achevé, mais àsoutenir une représentation évolutive du document dans une chaîne éditoriale partant de la rédaction, via les révisions et la sanction jusqu'à la diffusion, la consultation. Il faut étudier le processus au complet.

Vers une stratégie de déploiement

Concevoir une stratégie d'implantation SGML à la mesure du potentiel d'applications est un défi majeur. Il faut d'une part de la profondeur technique et d'autre part l'ampleur de vue pour la réingénierie. Le moment est opportun pour l'adoption de la norme SGML comme base pour le partage de l'information. Une occasion est offerte, il faut agir.

La façon de procéder devrait être la formation d'un groupe de travail interministériel de spécialistes de l'informatique et en gestion des documents et de l'information textuelle ainsi que de tout contenu concernant des éléments logiques définis comme pertinents dans la modélisation SGML (les apports de la technologie du référentiel seront recherchés).

Ce groupe s'associerait avec des experts du secteur privé pour élaborer une stratégie appropriée au contexte technologique et organisationnel de l'Administration et aux volontés de changement. Le caractère pragmatique de cette stratégie est important.

Les questions suivantes devraient être traitées:

- Expliquer la place de SGML en gestion des documents et ses principaux bénéfices pour un ministère particulier et pour l'ensemble du gouvernement; tracer les grandes lignes d'une démarche pour son implantation ou déploiement dans l'Administration en lui dessinant une place dans l'architecture gouvernementale en technologies de l'information.

- Identifier les éléments d'un système SGML y compris en rapport avec Wordperfect, le Web et les autres composantes techniques; analyser les questions relatives au français, suggérer des formats d'en-tête et d'autres volets de description et de référence, proposer des mécanismes pour un Répertoire des DTD à l'usage de l'Administration ainsi que dans un ministère, évaluer les DTD publiques les plus intéressantes à réutiliser avec ou sans adaptation dans l'Administration, et décrire les services communs aux applications à développer.

- Expliquer la façon dont on peut mener une analyse de documents et la constitution d'un groupe affinitaire pour l'établissement de conventions d'application dans un domaine: analyser les applications potentielles comme SIGA et la carte multi-services.

- Procéder à une première identification des domaines les plus opportuns pour les efforts interministériels.

- Établir la position actuelle de SGML et normes associées dans le marché international et lister les principaux points de vulnérabilité dans un horizon de quelques années.

Études complémentaires

Diverses études complémentaires plus modestes peuvent être souhaitées:

- Explorer les besoins de DTD pour la classe des documents administratifs.

- Explorer les complémentarités de concepts, méthodes et outils entre SGML, Hytime et DSSSL.

- Produire un Guide explicitant la méthodologie d'analyse des documents, de leur circulation et des activités qui y sont reliées.

- Mener une étude sur les capacités relatives à la modélisation des formulaires sur le Web et à l'enregistrement des renseignements de formulaires complétés dans les SGBD.

- Établir une première cible réalisable de francisation de SGML et documentation nécessaire, en partenariat francophone

Vers une nouvelle architecture

La réingénierie n'est pas sans toucher la façon de faire avec les technologies d'information elles-mêmes. Le client-serveur, les protocoles Internet, l'émergence des documents ne sont pas les seules sources du changement de contexte qui influencera les structures et l'organisation du travail en informatique. Le gouvernement des États-Unis mène depuis deux ans, avec son National Performance Review, une réinvention de ses organes administratifs. Une analyse de ce qui s'y produit a inspiré la vision présentée au tableau page suivante d'une architecture des technologies de l'information pour l'Administration publique au Québec. L'articulation générale du tableau est d'abord schématisée à la figure 3 qui montre un ensemble de services communs devant servir de plate-forme pour développer et faire fonctionner les applications. Les services communs se subdivisent en trois groupes: les services généraux forment le noyau réutilisé pour développer soit des services de domaine (par ex., juridique) soit des services pour un ministère ou organisme. L'ensemble de ces services communs sont à leur tour réutilisés dans les applications.

FIGURE 3 (voir page suivante)

Dans le tableau qui suit sont fournis des éléments de définition et des exemples pour les trois classes de services et pour les applications. À noter qu'il s'agit d'une synthèse personnelle de l'auteur et non pas d'une position de l'organisme qui l'emploie.

PROSPECTIVE DE L'ARCHITECTURE DES TECHNOLOGIES
DE L'INFORMATION AU GOUVERNEMENT DU QUÉBEC

SERVICES COMMUNS GÉNÉRAUX

Mise à la disposition des utilisateurs du réseau gouvernemental de services de base pour l'inforoute dans le contexte des normes ISO, des protocoles Internet et du marché, des systèmes d'exploitation comme Windows et des normes publiques produites pour le développement de services spécialisés et d'applications. Cette plate-forme est constituée de deux grands types de services :

. des procédures de réseau :

- messagerie et transport (TCP/IP, HTTP, SMTP...)

- interfaces (Mosaic, Netscape, Windows)

- référence (liens)

- archivage (en-tête)

- sécurité (contrôle d'accès, identification et authentification, confidentialité des données, intégrité des données, non répudiation).

. des objets d'information :

- référentiel pivot

- modèles de classes de documents et dépôts des instances de documents

- modèles de données et banques

- répertoires de termes et de noms propres

- listes, catalogues, registres.

DE DOMAINE

Services communs ayant été spécialisés pour un domaine. Le secteur juridique est un domaine important. D'autres exemples de domaines sont la géomatique, les approvisionnements (ou acquisitions), les ressources humaines, les ressources financières.  Le domaine du commerce électronique doit contribuer les services de paiement et de signature.

Le développement de services communs de domaine juridique dépend de l'élaboration concertée de conventions d'application pour le Québec sur des choses comme :

. des modèles de document (loi, règlement, jugement)

. des spécifications aux interfaces de production et de consultation

. un thésaurus juridique québécois

. des glossaires de spécialités du droit

. des spécifications pour l'impression et l'affichage des grandes classes de documents

DE MINISTÈRE/ ORGANISME

Services communs ayant été spécialisés pour un ministère/organisme.

Ces services communs sont développés en fonction d'une politique interne et de procédures établies et grâce à la l'élaboration de conventions d'applications internes. Ces services pourraient par exemple se préoccuper de :

. la spécification des services communs généraux et de domaine

. la création d'hyperdocuments juridiques et autres relativement à sa mission

. les règles de gestion de la circulation et de l'archivage de son information

APPLICATIONS

Recours aux services communs en vue de supporter les activités de gestion des documents ou de tout autre objet d'information en regard de la mission et des objectifs d'une organisation. Par exemple, dans le domaine juridique:

. élaboration des règles (par exemple : préparation d'un projet de loi, révisions, adoption, diffusion)

. application des règles (par exemple : émission d'un billet pour infraction routière, compléter un rapport d'impôt)

. connaissance des règles (par exemple : consultation des textes juridiques et de la jurisprudence).

CONCLUSION

La stratégie générale consiste, en gestion des documents et des textes, à passer du papier à l'électronique, en misant sur des normes stratégiquement choisies, en particulier SGML. Le groupe de normes reliées à SGML est important parce qu'il offre un format neutre et favorise l'interopérabilité à un niveau élevé de modélisation de l'information contrairement à une interopérabilité difficile qu'amènent les API (Application Programming Interface). Cette interopérabilité entre logiciels que procure SGML s'effectue grâce à la description des données et des documents parce qu'elle permet le partage des valeurs ajoutées par chaque outil.

Le langage et les outils SGML deviennent donc un élément stratégique en vue de l'élaboration de services communs aux applications : en offrant un contrôle logique ajustable du contenu des documents, SGML se situe au coeur des architectures de gestion de l'information de demain. En effet, les utilisateurs disposent ainsi de "poignées" pour contrôler la circulation et l'utilisation des documents vus comme des objets se comportant selon certaines règles, dans un domaine d'information et un contexte organisationnel donnés. Il y a peu de doute qu'en raison de la valeur informationnelle des documents, le langage SGML est appelé à devenir l'un des principaux outils de modélisation de l'information dans les organisations.

La multiplication des perspectives expertes sur SGML est à favoriser eu égard àl'importance que le phénomène SGML a pris suite à son adoption pour les documents diffusés sur le Web. Le moment est critique pour une action stratégique avec un langage qui permet de modéliser documents et information en un sens plus abstrait.


Envoyez vos questions et commentaires au CRDP
© CRDP
M.A.D. 8 juillet 1996