<?xml version="1.0" encoding="ISO-8859-1"?>
<?xml-stylesheet href="ePBLpaper11.css" type="text/css"?>
<?xml-stylesheet href="ePBLpaper11.xsl" type="text/xsl"?>
<!DOCTYPE paper SYSTEM "ePBLpaper11.dtd">
<paper id="proj4">
  <info>
    <title>La Standardisation de Documents</title>
    <authors>
      <author>
        <firstname>Silvia</firstname>
        <familyname>CADILLO</familyname>
        <homepageurl></homepageurl>
        <email>cadillo4@etu.unige.ch</email>
      </author>
    </authors>
    <date>30 juin 2005</date>
    <updated>30 juin 2005</updated>
    <keywords>
      <keyword></keyword>
    </keywords>
  </info>
  <abstract>Ce document a pour but de présenter les problématiques courantes de l'édition des documents pédagogiques (le cas d'étude de l'édition d'un livre), de montrer quelles sont les méthodes permettant de les résoudre, ainsi que d'effectuer un bref tour d'horizon des logiciels pour la création des documents électroniques.

</abstract>
  <introduction>
    <p>Ces dernières années, Internet est devenu la plate-forme universelle de diffusion d'informations, avec un essor de la communication, de la collaboration et de la diffusion de documents numériques. Notre vue sur l'enseignement prend un nouveau visage, nous assistons à un nouveau besoin de l'enseignement traditionnel dispensé dans des salles de cours. Il faut organiser les ressources pédagogiques nécessaires à la diffusion. Ces ressources peuvent être des diapositives, du texte, du son ou encore de la vidéo.<br/>Ainsi, s'adressant aux personnes (enseignants, chercheurs, écrivains, etc.,) impliquées dans la rédaction, édition et la publication de documents pédagogiques, ce travail a pour objectif principal de présenter la gestion du contenu de la documentation, en rappelant l'évolution du document numérique. Ensuite nous présenterons à travers un exemple concret les problèmes qui se posent lorsqu'on veut éditer un document sur le web. Finalement, nous proposons des solutions à ce sujet, en discutant des techniques actuelles de création de documents, et en faisant un bref tour de tables de logiciels actuels pour la standardisation des documents.</p></introduction>
  <main><h3>Le concept du document</h3>
<p>En effet, chacun dans notre domaine professionnel ou privé, émettons et consultons quotidiennement un grand nombre de documents et la banalité de l'acte n'incline pas à la réflexion. Les vocables pour désigner l'objet document ne manquent pas et les variations sur le thème sont nombreuses : information, donnée, ressource, fichier, écrit, texte, image, papier, article, oeuvre, livre, journal, feuille, page ... Évidemment, chacun de ces termes se réfère à un contexte particulier mais ils se rattachent tous, à des degrés divers, au concept du document, du latin <cite>" documentum "</cite> (du verbe <cite>" docere "</cite> : enseigner). <br/>Mieux gérer l'information signifie principalement deux choses : en premier lieu être apte à retrouver l'information pertinente, et en second lieu être capable de la produire sous une forme adaptée à son destinataire et à son médium.<br/>Quand les ordinateurs ont apparu et se sont investis massivement dans le domaine du traitement et de la production de textes, notre définition naturelle du document, étroitement liée au support papier est devenue plus abstraite. Le papier a été brûlé pour n'en récupérer que l'encre. Lorsque nous parlerons d'information, nous parlerons à la fois du texte et aussi de son, d'image, d'animation et plus encore. La notion de médium ou support devient alors ambiguë : s'agit-il du fichier, du disque physique, ou bien encore de l'écran où le document est affiché ?<br/>Le support électronique a généré également d'autres changements, notamment au niveau de la structure du document, des techniques de production, de stockage et de réutilisation de l'information qui se transforme en bien valuable.<br/>Concernant, le concept de structure, il faut dire que nous sommes habitués aux constituants implicites de la structure et de la hiérarchie du document comme les paragraphes qui parfois sont contenus dans des sections et des chapitres avec des relations d'appartenance entre les différents éléments d'un document (le titre, le chapitre, le sous chapitre, etc.). Nous repérons les paragraphes par un saut de ligne, les sections et les chapitres sont écrits plus gros et sont numérotés.<br/>Cette manière explicite d'exprimer la structure du document nous est cachée par son incarnation physique. Mais, ce qui nous intéresse dans le document n'est pas sa structure, mais l'information contenue par ce document. En revanche, la structure et la hiérarchie sont des clés permettant de mieux comprendre cette information.<br/>Nous sommes donc en présence d'infomation sur l'information, d'où le terme de <strong>" meta-information " </strong><br/>Nous venons de voir un type de méta-information, celle concernant la structure du document. Un autre type de méta-information est la variante typographique (gras, italique, soulignement, etc.,) qui est utilisé pour donner de l'emphase à l'information. Cette variante est qualifiée de la méta-information du type sémantique.<br/>Il existe aussi une troisième méta-information qui ne concerne pas le contenu du document, mais le document lui-même. C'est le cas de l'information sur les auteurs, sur la date et des autres renseignements qui ne sont pas directement liés au contenu du document.<br/>Cette découverte sur la méta-information d'un document nous permet de dire que : " l'information peut décrire, de l'information contenue dans le document ou le document lui-même. "<br/>Par la suite : nous allons aborder le document sous un angle plus dynamique en abordant son cycle de vie.</p><h3>Cycle de vie du document</h3>
<p>Un document donne un statut, confère une légitimité à une information car il est porté par le groupe social qui le suscite. Il constitue simultanément une <cite>preuve</cite>  qui fait foi d'un état de choses, une <cite>annonce</cite> qui prévient d'un événement, un <cite>discours</cite> qui se rattache à un auteur, un témoignage, une pièce de dossier. La diffusion de l'information qui contient un document doit dépasser la communication intime (la sphère privée) pour accéder à la légitimité.<br/>Prenons un exemple, pour mieux comprendre cette dynamique : dans une institution une pièce de dossier doit être rédigée. La personne qui la rédige devra la  taper sur l'ordinateur, puis va la soumettre vraisemblablement à une correction par son ou sa collègue, ensuite elle sera remise à la personne l'ayant demandée. Par la suite, cette dernière personne va la classer dans un dossier ou sous une pile d'autres dossiers. Enfin, quelqu'un voudra peut-être dans un premier temps consulter cette pièce du dossier et puis peut-être la modifier et ainsi de suite.<br/>Cette situation simple résume en fait assez bien les différentes étapes du cycle de vie d'un document.<br/><br/>Or, un document se voit d'abord <cite><strong>créé</strong></cite> par une ou plusieurs personnes. Il sera <cite><strong>produit</strong></cite> sur un support, que ce soit sur l'écran d'un ordinateur ou sur des feuilles de papier ; suite à cela il sera probablement <cite><strong>édité</strong></cite> puis stocké.<br/>On comprend aisément que ces différentes étapes de la vie d'un document ne sont pas exhaustives. Mais, ce cycle est une base sur laquelle chaque entité va pouvoir greffer ses sous étapes ainsi que les interactions avec ses différents acteurs.</p>
<h3>Le document en situation réel</h3>
<p>La précédente partie nous a proposé un cadre théorique dans lequel nous allons pouvoir poser les problèmes de l'élaboration des documents. Pour bien les comprendre, rien ne vaut mieux qu'une situation concrète.</p>
<p><strong>Etude de cas </strong></p>
<p>Nous allons prendre comme exemple le cas d'un professeur qui veut éditer[1]  un livre avec le but de le publier sur le web. Le professeur n'est pas formé à l'utilisation des outils pertinents pour l'édition des documents numériques. Nous sommes donc en présence d'un terrain vierge qui va nous permettre de passer en revue les différents problèmes que va rencontrer notre courageux professeur.</p>
<p><strong>Le format</strong></p>
<p>La première chose que le professeur doit faire est de récupérer ses écrits dans un format numérique, ou de les écrire avec un traitement de texte si cela n'était pas le cas.
Dans la plupart des cas, le document produit convient à une production papier (le livre) mais se prête relativement mal à une production en ligne (typiquement le format HTML).<br/>Ainsi vient le premier problème : le professeur doit pouvoir produire facilement des documents pour les deux supports (ici donc, le papier et le web). Dans la plupart des cas les solutions trouvées sont soit une réécriture du document destiné au papier en document HTML, ou bien une conversion "sauvage" du document original en document HTML. Ces deux solutions peuvent être acceptables à court terme, mais elles posent notamment deux problèmes:
</p><ul>
      <li>Etant donné que chaque support a des exigences ergonomiques propres, le fait d'avoir un document par support engendre au niveau des corrections ou des modifications, le problème non seulement de double travail, mais aussi celui de se focaliser plus sur la mise à jour plutôt que sur la rédaction du contenu de l'écrit.</li>
      <li>Convertir "sauvagement" ses documents ne présente pas exactement les mêmes défauts que de maintenir plusieurs versions. La conversion engendre en général un document qui n'est pas ou peu adapté à son support car la conversion ne prendra pas en compte les spécificités du support.</li>
    </ul>
<p><strong>Le public cible</strong></p>
<p>Un document une fois produit est vu par une personne, mais ce n'est pas toujours la même personne qui consulte le document. Un auteur, par contre, sait en général à qui il s'adresse, ou à qui il veut  s'adresser. Ainsi il s'agit pour lui de définir des ensembles de personnes, qui sont en fait le "public cible" de son document, et d'indiquer dans le document les parties qui concernent l'une ou l'autre "public cible". Ce concept est important dans le sens où il apporte la possibilité d'adapter le document à son "auditoire".  L'adaptation à son public cible (ou plutôt ses publics cibles) est un critère qui touche plus le contenu que la forme.</p>
<p><strong>La révision</strong></p>
<p>Ici, nous sommes confrontés à deux problématiques : </p><ul>
      <li>les corrections et les modifications du document et les annotations de celles-ci sur le document.</li>
      <li>la garde de la version du document antérieur aux modifications.</li>
     </ul>
<p>Tout ceci est tout à fait faisable sur un document papier, on peut directement faire des annotations sur le document ou y insérer un <cite>post-it</cite> contenant des notes. Il en est un peu différemment dans des logiciels actuels. <br/>Il s'agit aussi de gérer différentes versions, c'est à dire l'historique et les variantes de documents. Ceci permet de revenir dès qu'on le désire à une version donnée d'un document, et de consulter les mises à jour qui ont été effectuées.<br/>Pour satisfaire au problème de la révision, il faut donc concrètement pouvoir corriger, annoter, et garder un historique des documents et de leurs modifications.</p>
<p><strong>L'indexation </strong></p>
<p>Le livre du professeur est maintenant rédigé. Il s'agit par la suite de repérer dans celui-ci certains mots ou expressions particulièrement significatifs (appelés <cite>termes</cite>)dans un contexte donné, et de créer un lien entre ces termes et le texte original (méta-information). Par exemple, les <strong>pages d'index</strong> d'un livre reprennent (parfois) les termes significatifs apparaissant dans le livre, et les relient aux pages du livre où ces termes (ou leurs synonymes) apparaissent. Ceci facilite pour le lecteur la localisation des pages ou sections où l'on mentionne un sujet particulier. De même, la <strong>table des matières</strong> d'un livre est une forme (assez grossière) d'indexation. </p>
<p><strong>La publication</strong></p>
<p>La publication est un moment délicat, le moment où toutes les informations contenues dans le document entrent en jeu : ce stade cristallise ainsi toutes les attentions que les auteurs ont eu à l'égard du document : ainsi il s'agit de pouvoir publier la bonne version, pour la bonne personne, et dans le format adapté. <br/> Au cas où notre courageux professeur voudrait imprimer une version "du livre,"  il désirerait forcément avoir la toute dernière version, et avoir l'ensemble des informations supplémentaires : annotations, commentaires, dernières changements réalisés, etc...<br/>D'un autre côté, le professeur peut demander une version numérique non encore fini. Il ne voudra sûrement pas avoir une version du livre non finalisée, par contre, il attend un livre limité à son essentiel, de manière à pourvoir se faire un aperçu rapide de son contenu ; on retrouve ici les aspects d'adaptation du contenu au lecteur, et la notion d'historique.<br/>On comprend donc aisément que l'étape de production est avant tout technique : il faut que l'infrastructure de publication permette de gérer les différents paramètres du document, notamment l'indexation, la révision, et naturellement le format. Par ailleurs l'infrastructure de la publication doit connaître des informations sur le destinataire du document, de manière à servir un document qui conviennent le mieux possible aux attentes du destinataire, tant dans le contenu que dans la forme.</p>
<p><strong>La standardisation de la structure du contenu du document </strong></p>
<p>Supposons maintenant que le professeur veuille échanger le livre avec un professeur d'une autre université. Si tous les deux ont eu des démarches différentes pour l'édition des livres, les documents produits par l'un et par l'autre ne seront donc pas facilement échangeables.<br/>C'est de là que part la problématique de la standardisation : il s'agit de définir un format de documentation commun, afin que plusieurs auteurs d'origines variées soumettent des documents qui s'insèrent sans problème dans le système d'échange de l'information.<br/>La définition de ce format est un aspect très complexe, car il faut qu'il soit à la fois flexible (que tous les deux professeurs aient des éléments de marquage sémantique pour leur travail) et complet (les professeurs ont assez d'éléments de marquage pour s'exprimer). <br/>Paradoxalement, la multiplication des formats " propriétaires ou privés" a conduit à des situations d'illisibilité, difficilement tolérables pour l'utilisateur.<br/>Nous verrons par la suite qu'il existe un ensemble de technologies qui ont posé les premières pierres à une standardisation de la documentation. Ces technologies visent à rendre les documents accessibles (donc indexables), durables (donc maintenables),  interopérables (donc transportables dans des contextes technologiques variées et évolutifs) ainsi que réutilisables et adaptables. </p>
<p><strong>Des logiciels pour la création des documents électroniques</strong></p>
<p>Nous allons voir à travers l'évolution des logiciels pour la création de documents électroniques que la manière d'éditer des documents n'étaient pas la plus pertinente, dans le sens où ces logiciels mélangeaient forme et contenu et ne permettaient pas à l'origine de répondre à notre problématique abordé, dans le cas de l'édition du livre par un professeur.</p>
<p><strong>TEX</strong></p>
<p>Le logiciel <strong><cite>TEX</cite></strong>est un traitement de texte scientifique particulièrement adapté à l'écriture des symboles mathématiques, physique et science informatique.<br/>Il a été créé à partir de 1977 par le mathématicien Donald Knuth. TEX n'est pas un traitement de texte où le document en préparation apparaît à l'écran comme il est censé être une fois imprimé, mais un logiciel traduisant du texte en un document graphique. Cette traduction est non lisible par un humain, mais sera comprise par des logiciels de visualisation et éventuellement des imprimantes (fichier DVI[2] ). Le fichier DVI est ensuite lu par un autre
programme appelé gestionnaire de périphérique) qui produit la sortie qui est lisible par les humains.<br/>En fait, TEX était plus un logiciel pour le formatage et la mise en page, c'est-à-dire qu'il ne contenait pas la possibilité de <strong><cite>marquer la sémantique d'un document. </cite></strong>En autre, l'utilisation de TEX étant assez ardue pour un débutant, il a été étendu en LATEX.
Exemples des <a href="http://fr.wikipedia.org/wiki/Aide:Formules_TeX">formules TEX</a></p>
<p><strong>LATEX</strong></p>
<p>Leslie Lamport est à l'origine de <strong>LATEX</strong>qui est une collection de macro-commandes pour TEX. On pourrait présenter LaTeX comme le traitement de texte idéal pour les scientifiques. Il excelle dans le traitement des formules mathématiques et dispose en standard de tous les caractères mathématiques. Son coût modique en fait un logiciel parfaitement adapté au monde de l'enseignement.<br/>Le compilateur LATEX est basé sur l'idée que la rédaction d'un document est plus efficace en se concentrant sur la structure logique (la sémantique du document) en laissant au second plan les détails de mise en page. LATEX sépare donc le forme du contenu.<br/>LATEX est très utilisé dans le monde universitaire (pour sa gratuité, sa qualité et la possibilité de l'adapter à ses besoins en modifiant les macros) et dans des publications scientifiques.
Malgré sa syntaxe assez intuitive LATEX permet de rédiger rapidement des équations mathématiques tout en assurant un rendu parfait. Lors de la compilation d'un tel fichier, les titres, figures, équations sont numérotés de manières cohérentes, Cela permet de générer automatiquement sommaires de listes de figures en un minimum d'efforts. LATEX  dispose également d'un système de gestion des références bibliographiques très efficace, BIBTEX.  Exemple simple:</p>
<blockquote>
      <blockquote>
 <table border="1">
      <tr>
	<!-- one of (td th) -->
	<td>\documentclass[a4paper, 11pt]{article}<br/>\title{Exemple de document LaTeX}<br/>\begin{document}<br/>Coucou !<br/>\end{document}</td>
     </tr>
     </table>
      </blockquote></blockquote>

    <p><a href="http://fr.wikipedia.org/wiki/LaTeX">Source</a></p>

<p>Un exemple de math :</p>
      <blockquote>
      <blockquote>
      <table border="1">
	<tr>
	  <!-- one of (td th) -->
	  <td>${\displaystyle z=\left( \frac {e^{i\theta}+e^{-i\theta}}{2}\right)^2 +left(\frac{e^{i\theta}-e^{-i\theta}}{2i} \right)^2}$</td>
	</tr>
      </table> 
     </blockquote>
     </blockquote>
<p>Ce code va produire après compilation la formule mathématique :</p>
<blockquote>
    <blockquote>
      <table border="1">
	<tr>
	  <!-- one of (td th) -->
	  <td><img src="http://tecfa.unige.ch/staf/staf-k/cadillo/staf18/formule.jpeg" alt="formule"/></td>
	</tr>
      </table>
</blockquote></blockquote>

<p><strong>SGML (Standard Generalized Markup Language)</strong></p>
<p>Le langage SGML est un langage de description à balises qui est utilisé pour décrire la structure logique d'un document, et non son aspect typographique. Le document est vu comme une structure arborescente et son organisation doit respecter une DTD. Par exemple : on ne peut pas avoir de chapitre à l'intérieur d'un paragraphe. Le principe appliqué est le marquage du contenu d'un document en définissant les titres, auteurs, chapitres, sous-chapitres d'un document, et en identifiant les graphiques et autres types de données. Cette description standardisée permet donc de lire les documents créés selon cette norme sur n'importe quel type de machine, ce qui facilite leur réutilisation et leur circulation sous forme électronique.<br/>Le SGML assure en particulier que tout document pourra être relu, quelle que soit l'évolution des systèmes et des traitements de texte. Le langage SGML est aujourd'hui surtout utilisé dans les agences gouvernementales, les industries aéronautique et pharmaceutique ainsi que dans l'édition.<br/>Le problème de SGML est qu'on ne peut pas écrire un document sans avoir auparavant dicté les  règles qui vont contraindre sa structure (DTD)</p>
<p><strong>HTML (HperText Markup Language)</strong></p>
<p>HTML  est un langage de balisage de texte qui permet la création des documents affichables par un navigateur web. C'est une application du langage à balises SGML avec une syntaxe fixe et non extensible.<br/>On distingue quatre types de balisage en HTML:</p><ul>
      <li>le balisage structurel : il décrit le but d'un élément d'une page ;</li>
      <li>le balisage hypertexte : il lie un élément d'une page à une autre ressource située sur le Web ;</li>
      <li>le balisage de présentation : il décrit l'apparence que doit prendre un élément d'une page ;</li>
      <li>le balisage "utilitaire" ou "accessoire" : il sert à créer des objets précis tels que des boutons   
  par exemple.</li>
    </ul>
<p>Le balisage de présentation montre que HTML ne sépare pas la forme du contenu du texte qui est une caractéristique fondamentale pour la création de textes numériques. Exemple :</p>
<blockquote><blockquote>
      <table>
	<tr>
	  <!-- one of (td th) -->
	  <td><img src="http://tecfa.unige.ch/staf/staf-k/cadillo/staf18/html2.jpg" alt="html" align="center"/></td>
	</tr>
      </table>
    </blockquote></blockquote>
  
<p><strong>XML (Extensible Markup Language)</strong></p>
<p>XML (entendez <cite>extensible Markup Language </cite>et traduisez<cite>Langage à balises étendu,</cite> ou <cite>Langage à balises extensible</cite>)définit la structure, le contenu, la sémantique, indépendamment de la mise en page du document. <br/>XML n'est pas un langage, mais un méta-langage, c'est-à-dire un outil permettant de créer des langages. XML permet aussi de définir de noms d'éléments, d'attributs en n'importe quelle langue (arabe, russe, etc.)<br/>Les balises utilisées en XML capturent uniquement la structure logique du document (son articulation en partie et sous parties) et ses données, qu'il intègre dans le même fichier. 
Ainsi le contenu d'un document au format XML est structuré grâce à des balises en forme arborescente. <br/>L'extensibilité (c'est à dire la possibilité de rajouter des balises) de XML est illimitée. La tâche de la représentation visuelle du document XML est confiée aux feuilles de styles spécifiques, et ainsi générer autant de formats d'affichage, d'impression, de diffusion, etc. que l'on souhaite.<br/>XML permet aussi de stocker et d'échanger des données structurées, pour ainsi gérer le contenu du document XML.<br/>En réalité les balises XML décrivent le contenu plutôt que la présentation (contrairement à HTML). Ainsi, XML permet de séparer le contenu de la présentation ce qui permet par exemple d'afficher un même document sur des applications ou des périphériques différents sans pour autant nécessiter de créer autant de versions du document que l'on nécessite de représentations ! <br/>XML a la particularité d'être plus souple que SGML, car il n'exige pas l'existence préalable d'une DTD.  XML est aussi plus simple, car il a moins d'exceptions syntaxiques.
XML a été développé par le World Wide Web Consortium pour permettre aux documents publiés sur Internet une plus grande richesse sémantique, et donc de pouvoir répondre aux problématiques que nous avons abordées précédemment.
</p>
<p><strong>Les solutions : les documents structurés</strong></p>
<p>Nous venons de voir que ces dernières années plusieurs logiciels ont essayé d'apporter une solution viable à l'édition de documentation, permettant de remplacer les traitements de texte dont le plus connu est sans conteste Microsoft Word. <br/>Paradoxalement, pour l'utilisateur habituel, comme l'est notre professeur qui veut éditer sur le web, le traitement de texte est souvent la référence en matière de texte numérique. C'est pourquoi il nous pose la question suivante: <cite>" Pourquoi ne pas utiliser Microsoft Word comme outil de documentation ? "</cite><br/>Nous allons donner réponse à cette question, en lui montrant  un certain nombre de problèmes qu'il va rencontrer lors de la rédaction du livre :</p>
<ul>
      <li>Etant donné que les versions de Word changent après un certain temps, le premier problème rencontré est l'incompatibilité des versions Word. Le professeur ne pourra pas lire le document rédigé avec des versions anciennes de Word.</li>
      <li>Le format Word est un format fermé, limité. Il est donc peu portable.</li>
      <li>L'exportation d'un document Word en HTML est problématique. Ceci ne permet donc pas de rendre consultable la documentation sur un site Internet, si ce n'est en effectuant un travail manuel de conversion.</li>
      <li>On perd souvent beaucoup de temps à mettre en forme le document plutôt que de travailler sur le fond (même si un bon modèle peut permettre de gagner du temps.)</li>
    </ul>
<p><strong>Cahier de charges d'un outil de documentation</strong></p>
<p>Voici les points à tenir en compte pour choisir un outil de documentation :</p>
<ul>
      <li>Pérennité du format. Il faut être sûr qu'on va pouvoir accéder à la documentation dans dix ans s'il le faut.</li>
      <li>Le format choisi doit pouvoir accéder aux documents de n'importe quel poste de travail et en utilisant d'importe quel système d'exploitation également.</li>
      <li>Les différentes balises du format choisi doivent permettre de donner du sens au texte. La mise en forme ne doit pas rentrer en compte au moment de la rédaction.  </li>
      <li>Il faut pouvoir établir facilement des liens entre différentes parties d'un document car ces dernières sont très souvent liées.</li>
      <li>Il est nécessaire que le standard de documentation soit connu et reconnu.</li>
    </ul>
<p>Nous pouvons déduire suite au cahier des charges ci-dessus présenté  que le format XML a vocation à devenir le format d'échange universel des données structurées qui transitent sur le Web. Ainsi, toutes les solutions que nous aborderons par la suite sont des solutions utilisant, ou basées sur ce type de méta-langage. </p>
<p><strong><a href="http://feloy.free.fr/dbmanual/book1.html">DOCBOOK</a></strong></p>
<p>XML Docbook est en fait une <strong>DTD (Document Type Definition) </strong>définissant un langage XML permettant d'écrire des documentations (sous forme d'articles ou d'ouvrages.) Même s'il est plutôt orienté informatique dans sont état actuel, il n'est à priori pas limité à cet usage.
Docbook existe en deux versions SGML et XML. Sa force est d'être un format XML, totalement orienté sémantique, il n'inclut en effet aucune information de mise en forme ce qui permet d'utiliser ensuite la documentation ainsi structurée sur tout type de support.<br/>Par structuration, nous insistons sur le fait que chaque élément du texte est très clairement identifié, et deuxièmement, par sa position dans l'arborescence XML qui le positionne très distinctement par rapport à ses ancêtres, sa descendance, ses semblables, etc. 
Nous avons jusqu'ici parlé du contenu, voici venir la présentation de ce contenu. Un ensemble de feuilles de styles XSL est disponible pour transformer des documents Docbook vers de nombreux formats comme :</p>
<ul>
      <li>HTML : pour une publication en ligne en une seule page HTML, ou plusieurs pages dont le découpage logique est au choix de l'utilisateur.</li>
      <li>Aide HTML : format des pages d'aide du navigateur d'aide de Microsoft Windows</li>
    </ul>
<p>Ces <strong>feuilles de styles XSL </strong> sont plus que de simples outils de mise en page car elles réalisent tout le travail de structuration de la documentation. On peut ainsi générer une table des matières de la profondeur souhaitée, la numérotation des titres de section se fait automatiquement, les liens entre les différents documents produits sont eux aussi fait automatiquement, on peut choisir le degré de structuration du document en indiquant à partir de quelle profondeur.<br/>Ces feuilles de style XSL sont aisément personnalisables et permettent d'arriver à un résultat correspondant parfaitement à ce qu'on souhaite.<br/>L'exemple suivant montre la structure d'une feuille de styles. Une feuille de styles est représentée par l'élément " xsl:stylesheet " dans un document XML. " xsl:transform " est autorisé comme synonyme de " xsl:stylesheet. " 
L'élément " xsl:stylesheet " doit avoir un attribut <cite>" version "</cite>  indiquant la version de XSLT exigées par la feuille de style. Pour cette version de XSLT, la valeur doit être 1.0. Lorsque la valeur n'est pas égale à 1.0, le traitement en compatibilité ascendante est activé.</p>
    <p><a href="http://www.w3.org/TR/xslt">Source</a></p>
<blockquote>
    <blockquote>
<table border="1">
      <tr>
	<!-- one of (td th) -->
	<td><img src="http://tecfa.unige.ch/staf/staf-k/cadillo/staf18/stylesheet.jpg" alt="stylesheet"/></td>
      </tr>
    </table>
<p>Document xml </p><table border="1">
      <tr>
	<!-- one of (td th) -->
	<td><img src="http://tecfa.unige.ch/staf/staf-k/cadillo/staf18/xml-docbook.jpg" alt="xml"/>
</td>
      </tr>
    </table>
<p>La transformation en HTML sera:</p>
<table border="1">
      <tr>
	<!-- one of (td th) -->
	<td><img src="http://tecfa.unige.ch/staf/staf-k/cadillo/staf18/trasn-html.jpg"/></td>
      </tr>
    </table>
</blockquote></blockquote>
<p>XSLT est un langage dédié à la transformation de données XML, faisant partie de XSL qui est le langage des feuilles de style de XML. En plus de XSLT,  XSL inclus un vocabulaire XML pour la spécification de formatage. XSL spécifie les règles de présentation d'un document XML en utilisant XSLT, pour décrire comment le document peut être transformé en un autre document qui utilise le vocabulaire de formatage.<br/>Saxon est un parser Java. Il permet de faire des transformations XSL (comme les docbook-xsl.)<br/>Bien que Docbook soit une DTD très complet pour produire du texte structuré, elle n'est pas la seule solution. D'autres DTD sont aussi adaptées à des contextes différents de la documentation pédagogique. </p>
<p><strong>Simplifiée Docbok</strong> </p>
<p>Nous avons vu que DocBook est défini comme une grammaire d'écriture de documents structurés en SGML ou en XML. Destiné initialement à la structuration de livres et d'articles informatiques, DocBook trouve des domaines d'applications dans bien d'autres types de documents.<br/>Par ailleurs sa popularité allant croissant, les initiateurs de DocBook ont publié plusieurs extractions de la D.T.D. principale dont la DTD simplifié de DocBook qui est particulièrement adaptée pour la structuration d'articles et notamment pour la publication sur le WEB. <br/>La DTD simplifiée de DocBook DTD est identifiée par :</p>
     <ul>
      <li>l'identificateur public formel (F.P.I.) : </li>
    </ul>
    <table border="1">
      <tr>
	<!-- one of (td th) -->
	<td>"-//OASIS//DTD Simplified DocBook XML V4.1.2.5//EN", </td>
      </tr>
    </table>
    <ul>
      <li>l'identificateur système: </li>
    </ul>
    <table border="1">
      <tr>
	<!-- one of (td th) -->
	<td>"http://www.oasis-open.org/docbook/xml/simple/4.1.2.5/sdocbook.dtd".</td>
      </tr>
    </table>
    <p>La DTD de Simplifiée Docbook est composée de :</p>
<ul>
      <li>106 éléments,</li>
      <li>525 entités :<br/>302 entités paramètres<br/>223 entités générales </li>
      <li>26 notations</li>
    </ul>
<p>Le document <cite>article</cite> est un sous ensemble du document <cite>book.</cite>  On ne trouvera donc pas d'élément <cite>chapter</cite> par contre on retrouve <cite>sect1</cite> et <cite>sect2</cite> ainsi que <cite>para</cite><br/>Nous vous conseillons tout de même d'utiliser <cite>book</cite> dès que le document fait plus de 2 ou 3 pages. Exemple : </p>
<blockquote><blockquote>
    
    <table border="1">
      <tr>
	<!-- one of (td th) -->
	<td><img src="http://tecfa.unige.ch/staf/staf-k/cadillo/staf18/article2-copie.jpg" alt="article"/></td>
      </tr>
    </table>
</blockquote></blockquote>
<p>Pour plus d'informations voir <a href="http://feloy.free.fr/dbmanual/book1.html">Manuel Docbook</a></p>
<p><strong>DITA (Darwin Information Typing Architecture)</strong></p>
<p>DITA est une architecture ouverte permettant de décrire des topics extensibles (concepts, tâches, références) composés d'un titre, suivi d'une courte description, de textes complets (et d'images) pouvant être orga-nisés en sections. Un <cite>topic</cite> peut être autonome ou rattaché à un <cite>topic parent</cite> dont il peut "hériter" les propriétés et inaugurer une hiérarchie. De plus, DITA permet d'organiser des <cite>topics</cite> voisins en <cite>Information Type.</cite> Ce type d'organisation permet de réaliser des recherches pertinentes par type de topics et donc de présenter à l'utilisateur uniquement l'information qui lui convient, pour réaliser une tâche particulière.<br/>L'objectif de DITA est de constituer des référentiels documentaires assemblables par configuration de publication. L'idée de base est, sur un sujet donné, de créer l'ensemble des modules d'informations qui seront nécessaires à la compréhension et à "l'opérationnalité" de l'utilisateur. Ceci fait, les modules s'assemblent par configuration, soit en fonction de parcours de cet utilisateur, sur un support électronique, soit en fonction d'un ordre pré-établi, pour une publication papier. Exemple :</p>
    <p><a href="http://www-106.ibm.com/developerworks/xml/library/x-dita3/sidesampletopic1.html">Source</a></p>
<blockquote>
   <blockquote>
<table border="1">
      <tr>
	<!-- one of (td th) -->
	<td><img src="http://tecfa.unige.ch/staf/staf-k/cadillo/staf18/dita-copie.jpg" alt="dita"/></td>
      </tr>
    </table>
 </blockquote> </blockquote>
<p>Pour plus d'information voir <a href="http://www-106.ibm.com/developerworks/xml/library/x-dita3/index.html">Frequently Asked Questions about the Darwin Information Typing Architecture</a> </p>
<p><strong>Logiciels d'édition</strong></p>
<p>Des éditeurs XML pouvant créer ou modifier un fichier XML, tout en respectant la DTD Docbook existent. Ces éditeurs sont divisés en deux familles : les éditeurs XML travaillant uniquement sur l'arborescence et les éditeurs acceptant des feuilles de style comme CSS sur les balises.<br/>Les éditeurs XML les plus simples qui ne travaillent que sur l'arborescence sont en général des freewares et servent à valider le document avec une DTD.</p>
<h2><a href="http://www.xerlin.org/">Xerlin</a></h2>
<p>Licence : libre</p>
<p>Systèmes : JVM (Windows, Linux, MacOS...)</p>
<p>Langage : Java</p>
<p>Version : 1.2</p>
<p>Cet éditeur, dont la dernière version stable date de juin 2002, est plutôt limité. Il ne permet que l'édition en mode arbre, et n'est pas vraiment conçu pour être utilisé avec DocBook et ses centaines de balises.<br/>D'après sa documentation, il serait plutôt étudié, grâce à une API adequate, pour pouvoir utiliser des plugins rendant l'édition plus facile ou plus spécifique aux besoins de l'utilisateurs. Le nombre de plugins disponibles semble cependant assez limité...</p>
    <p><a href="http://calandoa.free.fr/web/docbook/images/s_xerlin.jpg">Source</a></p><blockquote>
      <blockquote>

<table border="1">
      <tr>
	<!-- one of (td th) -->
	<td><img src="http://tecfa.unige.ch/staf/staf-k/cadillo/staf18/xerlin.gif" alt="xerlin"/></td>
      </tr>
    </table>
      </blockquote> </blockquote>

<h2><a href="http://qemacs.org/">Qemacs</a></h2>
<p>Licence : LGPL</p>
<p>Systèmes : Unix-like</p>
<p>Langage : C</p>
<p>Version : 0.3.1</p>
<p>Cet éditeur possède l'interface et les principales fonctionnalités d'Emacs, tout en restant très petit. Il possède d'autres fonctionnalités intéressantes, comme par exemple l'édition simultanée en mode source ou en mode WYSIWYG. Il ne se limite pas à DocBook et est aussi conçu pour d'autres langages.<br/>Il manque cependant encore de maturité et ne propose pas de fonctions spécifiques à DocBook comme l'auto-complètement, la validation, la conversion...</p>
    <p><a href="http://calandoa.free.fr/web/docbook/images/qemacs.png">Source</a></p>
<blockquote>
   <blockquote>
<table border="1">
      <tr>
	<!-- one of (td th) -->
	<td><img src="http://tecfa.unige.ch/staf/staf-k/cadillo/staf18/qemacs.png" alt="qemacs"/></td>
      </tr>
    </table>
</blockquote> </blockquote>
<h2><a href="http://www.japisoft.com/xmlpad/">JXMLpad</a></h2>
<p>Licence : Shareware, évaluation gratuite.</p>
<p>Systèmes : JVM (Windows, Linux, MacOS...)</p>
<p>Langage : Java</p>
<p>Version : 1.9.2</p>
<p>Ce petit éditeur est en fait un composant Java qu'il est possible d'intégrer dans d'autres applications. Il propose l'édition en mode source avec colorisation syntaxique et une vue sous forme d'arbre.</p>

<blockquote>
      <p><a href="http://calandoa.free.fr/web/docbook/images/jxmlpad.jpg">Source</a></p>
   <blockquote>

<table border="1">
      <tr>
	<!-- one of (td th) -->
	<td><img src="http://tecfa.unige.ch/staf/staf-k/cadillo/staf18/jxmlpad.jpg" alt="jxmlpad"/></td>
      </tr>
    </table>
</blockquote> </blockquote>
<p>Il existe des éditeurs XML complets qui acceptent des feuilles de style comme CSS sur les balises. Exemple :</p>
<h2><a href="http://www.xmlmind.com/xmleditor/index.html">XXE (XMLmind XML Editor)</a></h2>
<p>Licence : commerciale et gratuite (fonctionnalités restreintes)</p>
<p>Systèmes : JVM (Windows, Linux, MacOS...)</p>
<p>Langage : Java</p>
<p>Version : 2.4</p>
<p>Il s'agit là aussi d'un des meilleurs éditeurs disponibles. Édition possible en mode WYSIWYG et arbre simultanément. Correcteur orthographique. Interface très pratique.</p>

<blockquote>
      <p><a href="http://calandoa.free.fr/web/docbook/images/xxe.gif">Souce</a></p>
   <blockquote>

<table border="1">
      <tr>
	<!-- one of (td th) -->
	<td><img src="http://tecfa.unige.ch/staf/staf-k/cadillo/staf18/xxe.gif" alt="xxe"/></td>
      </tr>
    </table>
</blockquote> </blockquote>
<h2><a href="http://www.oxygenxml.com/index.html">oXygen</a></h2>
<p>Licence : commerciale, évaluation gratuite pendant 30 jours</p>
<p>Systèmes : JVM (Windows, Linux, MacOS...)</p>
<p>Langage : Java</p>
<p>Version : 2.0.3</p>
<p>Cet éditeur est spécialisé dans le mode source où il offre une possibilité d'auto-complètement des balises au fur et à mesure qu'on les tape. Il existe aussi un mode arbre, mais qui est malheureusement affiché dans une fenêtre différente.<br/>Configuration de la conversion du document XML vers un autre format intégré à l'interface.
Correcteur orthographique intégré.</p>

<blockquote>
      <p><a href="http://calandoa.free.fr/web/docbook/images/oxygen.gif">Source</a></p>
   <blockquote>
    
<table border="1">
      <tr>
	<!-- one of (td th) -->
	<td><img src="http://tecfa.unige.ch/staf/staf-k/cadillo/staf18/oxygen.gif" alt="oxygen" height="500" width="750"/></td>
      </tr>
    </table>
</blockquote> </blockquote>
<h2><a href="http://jaxe.sourceforge.net/Jaxe.html">Jaxe (pour documents Docbook simplifiés)</a></h2>
<p>Licence : GPL</p>
<p>Systèmes : JVM (Windows, Linux, MacOS...)</p>
<p>Version : 1.7</p>
<p>Petit éditeur, simple mais complet, avec la liste des balises possibles accessible facilement</p>
<p>Mode d'édition unique avec balises simples ou sur une ligne.</p>
<p>Aucun raccourci clavier! </p>
<p>Rendu HTML accessible depuis l'interface.</p>
<p>Correcteur orthographique.</p>

<blockquote>
      <p><a href="http://calandoa.free.fr/web/docbook/images/jaxe.png">Source</a></p>
   <blockquote>
<table border="1">
      <tr>
	<!-- one of (td th) -->
	<td><img src="http://tecfa.unige.ch/staf/staf-k/cadillo/staf18/jaxe.png" alt="jaxe" height="500" width="750"/></td>
      </tr>
    </table>
</blockquote> </blockquote>
<h2><a href="http://www.morphon.com/">Morphon </a></h2>
<p>Cet éditeur est l'un des meilleurs disponibles, et il présente l'avantage d'être distribué gratuitement. Il permet d'éditer le document en mode WYSIWYG[3], avec balises visibles (simples ou encadrant leur contenu) et en mode source (arborescence).<br/>L'éditeur  Morphon se compose de deux parts intégrales: le rédacteur de XML et l'éditeur CSS.<br/>Le XML Morphon permet aux utilisateurs de créer des documents XML valides et bien formés. Il aide donc l'utilisateur à écrire des documents selon le type de données choisi (par exemple la DTD Docbook), rendant impossible d'écrire XML de manière incorrect. <br/>Le Morphon CSS-Editor permet aux utilisateurs de créer un modèle visuel pour le XML en utilisant une interface graphique facile. CSS ajoute des styles sur les balises, les listes, la numératotation, l'affichage des images, le rendu de tableaux.<br/>Morphon offre de nombreux avantages : </p><ul>
      <li>Un éditeur de texte presque WYSIWYG  et une vue hiérarchique du document.</li>
      <li>Il est possible d'éditer des tableaux et d'afficher des images JPEG et GIF lors de l'édition</li>
      <li>Il est entiérement écrit en Java 2 et est disponible sur beaucoup de plates-formes : Windows, Unix et Mac OS.</li>
      <li>Il possède des avantages comme l'internalisation[4]  et la transformation du document en utilisant XSL.</li>
      <li>Il a un correcteur orthographique.</li>
    </ul>

<blockquote>
      <p><a href="http://calandoa.free.fr/web/docbook/images/morphon.gif">Source</a></p>
   <blockquote>
<table border="1">
      <tr>
	<!-- one of (td th) -->
	<td><img src="http://tecfa.unige.ch/staf/staf-k/cadillo/staf18/morphon.gif" alt="morphon" height="670" width="900"/></td>
      </tr>
    </table>
</blockquote> </blockquote>
<p>Le document XML créé avec l'éditeur MORPHON est montré dans la figure ci-dessus. A gauche se trouve une fenêtre montrant l'arborescence du document.<br/>A droit en bas se trouve une fenêtre montrant la hiérarchie d'éléments composant la structure logique du document courant est défini par la DTD (dans ce cas de Docbook) Cette structure définit les types des éléments pouvant intervenir dans un document et la façon dont ils peuvent être combinés pour former la structure du document. Par exemple, la structure logique du livre de la DTD Docbook énonce qu'un livre (book) est composé successivement des éléments title, bookinfo, chapter, reference, appendix. Cette structure énonce également qu'un chapter est composé d'un titre du chapter et des paragraphes.<br/>Au milieu, on trouve la fenêtre d'édition pour le rendu avec la feuille de style et l'ajout de texte pour les éléments.<br/>On aurait préféré que l'éditeur n'utilise qu'une seule zone de travail (la fenêtre d'édition), la fenêtre d'arborescence semble utilisé uniquement pour naviguer. De plus, il n'y a pas de lien de la zone d'édition vers la zone de l'arborescence : ce qui engendre des difficultés pour se repérer dans la structure.<br/> </p>
<h2>Des autres éditeurs XML</h2>
<p>Nous avons aussi regardé s'il était éventuellement possible d'utiliser un traitement de texte de type WYSIWYG comme Word ou StartOffice. Ces logiciels ont des avantages comme l'ergonomie et la facilité d'utilisation, mais sont mal adaptés à notre contexte, comme nous l'avons montré dans la rubrique : <cite>Les solutions : les documents structurés</cite><br/>Il existe aussi FrameMaker 7.0 de Adobe qui permet de créer et d'éditer  des fichier XML, validés en WYSIWYG. Il fonctionne sous Windows, Mac OS et Unix. Ce produit permettra peut-être au professeur d'éditer son livre mais est très cher et il est un peu compliqué de le mettre en œuvre. <br/>Pou finir, on peut voir qu'il n'existe donc pas encore de solution idéale en matière de logiciels pour l'édition de documents, mais on conseillera au professeur d'utiliser l'éditeur MORPHON pour éditer son livre. </p>
</main>
  <conclusion>
    <p>Il serait injuste de conclure sans apporter une solution concrète au courageux professeur pour qu'il puisse éditer son livre sur le web et sur papier. Etant donné que le professeur n'a pas de connaissances solides en informatique (il arrive à rédiger des documents simples en Word), il va donc falloir qu'il utilise des logiciels spécifiques et simples pour l'édition des livres.</p>
    <p>
Ainsi, dans un premier temps il faut qu'il s'habitue aux formats standards XML, ainsi qu'à la DTD Docbook. Ceci fait que le professeur peut postérieurement avec la pratique et l'expérience choisir une extension de cette DTD constitué par un ensemble de mark-ups spécifiques à son livre.<br/>Par la suite, il pourra utiliser l'éditeur MORPHON pour générer DOCBOOK. Puis, les feuilles de style XSL et le processeur XSLT vont lui permettre de transformer le livre XML Docbook écrit en divers formats tels le HTML, PDF, aide HTML Microsoft.</p>
    <p>Par ailleurs, nous avons vu que la spécification DocBook contient en elle même deux formats: un format simplifié destiné à écrire de simples articles et un format exhaustif et complet pour écrire des documents plus gros.  On peut donc aussi conseiller au professeur de commencer avec Simplifié Docbook afin de se familiariser avec la DTD. Par la suite, il pourra travailler avec Docbook officiel pour éditer des livres.</p>
</conclusion>

  <references>

<reference><p><a href="http://www.mutu-xml.org/xml-base/shared/KEY-DITA.html">DITA - Darwin Information Typing Architecture</a></p></reference>
<reference><p><a href="http://fr.wikipedia.org/wiki/DocBook">Docbook</a></p></reference>
<reference><p><a href="http://camille.begnis.org/publications/DocBook/DocBook.pdf">DocBook, la quatrième dimension de la documentation technique</a></p></reference>
<reference><p><a href="http://people.type-z.org/seb/pro/IR00-gestion-documents.pdf">Gestion et structure de documents</a></p></reference>
<reference><p><a href="http://fr.wikipedia.org/wiki/HTML">HTML HyperText Markup Language</a></p></reference>
<reference><p><a href="http://calandoa.free.fr/web/docbook/introdb.html#id2797584">Introduction à Docbook</a></p></reference>
<reference><p><a href="http://cvs.orion.education.fr/homepages/docbooks/docbook/syntaxe.html">La formation d'un document Docbook</a></p></reference>
<reference><p><a href="http://fr.wikipedia.org/wiki/LaTeX">LaTeX</a></p></reference>
<reference><p><a href="http://feloy.free.fr/dbmanual/index.html">Manuel DOCBOOK (français)</a></p></reference>
<reference><p><a href="http://www.pipouyou.net/articles/docbook/pourquoi">Pourquoi utiliser XML DocBook ?</a></p></reference>
<reference><p><a href="http://fr.wikipedia.org/wiki/SGML">SGML Standard Generalized Markup Language</a></p></reference>
<reference><p><a href="http://xmlfr.org/w3c/TR/xslt/">Transformations XSL (XSLT) Version 1.0</a></p></reference>
<reference><p><a href="http://fr.wikipedia.org/wiki/TeX">TeX</a></p></reference>
<reference><p><a href="http://tecfa.unige.ch/staf/staf-e/clavel/memoire/memoire.pdf">Un environnement de développement pour TECFA</a></p></reference>
<reference><p><a href="http://cvs.orion.education.fr/homepages/docbooks/docbook/index.html">Utilisation simplifiée de DOCBOOK</a></p></reference>
<reference><p><a href="http://fr.wikipedia.org/wiki/Xml">XML Extensible Markup Language</a></p></reference>
  </references>
  <annex>
    <p>[1] Ecrire un document sur un support pour le publier<br/>[2]<strong>DVI</strong> est un format de fichier ouvert utilisé par le système de composition de texte TeX. <cite>DVI</cite> est l'abréviation de <cite>device-independent,</cite> ce qui signifie " indépendant du type d'unité (ou périphérique) ". Ainsi, un fichier DVI peut être imprimé sur presque n'importe quel type d'appareil de sortie typographique.<br/>Les fichiers DVI peuvent être visualisés ou imprimés avec les programmes <cite>xdvi </cite> ou <cite>kdvi</cite> sous unix et <cite>yap</cite> sous Windows.<br/>[3]What You See Is What You Get : littéralement : " ce que tu vois est ce que tu as "<br/>[4]L'éditeur doit pouvoir s'adpter à différents langages (français, anglais, chinois, etc.,) et à différentes régions géographiques (Europe, Asie, etc.,) sans utiliser les services d'un ingénieur.
</p>
</annex>
  
</paper>

