jeudi 26 juin 2008

XML


Le format des documents OpenOffice

Le standard OpenDocument est l'alternative libre et ouverte aux formats bureautiques propriétaires. Il est basé sur un ensemble de fichiers XML. Leur contenu et leurs balises en détail. (24/01/2006)

Le format OpenDocument (ODF, pour Open Document Format), créé par le consortium Oasis et implémenté en standard au sein de la suite bureautique OpenOffice.org, propose un équivalent libre et ouvert aux formats proposés par la suite de Microsoft : les fichiers Word, Excel, Powerpoint ou Access trouvent donc un équivalent accessible et pérenne auprès de l'ODF. Les qualités de ce format ne se limitent cependant pas à un recopiage libre de formats propriétaires ; ses capacités dépassent le simple cadre du traitement de texte.
Le standard OpenDocument met en avant quatre principaux formats de fichiers : .odt pour les textes, .ods pour les tableurs, .odp pour les présentations, .odg pour les graphiques et .odb pour les fichiers de base de données. En tout, 12 formats sont disponibles.
Selon les besoins, un fichier ODF est soit un simple document XML décrivant les informations à l'aide de balises connues, soit un fichier compressé (format Zip) contenant une archive de fichiers XML et de documents attachés (images, sons, ...). C'est ce second cas qui est rencontré le plus souvent, car il facilite tant la transmission du fichier (taille réduite) que son interprétation par un autre système (les données binaires y sont conservées plus proprement).
La composition d'un fichier ODF varie d'un format à l'autre, car les besoins ne sont évidemment pas les mêmes pour un éditeur de texte que pour un graphique. On retrouve cependant le plus souvent les informations suivantes...
Fichiers contenus dans un document texte
1) content.xmlIl s'agit de la racine du document, le fichier qui contient l'information elle-même (hors données binaires). Fortement inspiré par HTML.
2) styles.xmlLes informations stylistiques : couleur, taille de la police, hauteur de la page, mise en forme des listes. ODF se sert exclusivement des styles pour mettre en page ses documents : ce fichier est donc nécessaire si l'on veut retrouver le document comme il a été créé.
3) settings.xmlContient les réglages stockés lors de la sauvegarde du document : position du curseur, zoom, ...
4) meta.xmlDate de création, date de dernière modification, langage utilisé, auteur... : toutes ces métadonnées sont stockées et mises à jour dans ce fichier.
4) mimetypeUn fichier d'une ligne, sans extension, précisant le type MIME du fichier
5) META-INF/manifest.xmlLe manifest est une liste de l'ensemble des fichiers contenus dans l'archive, de la même manière que le fichier équivalent dans les archives JAR.
6) /PicturesCe dossier contient toutes les images utilisées depuis les autres documents de l'archive. Ceux-ci font référence directe aux images, souvent au format PNG.
De la même manière, la composition du fichier content.xml varie énormément selon le format, mais chaque format utilise des balises communes.
Ainsi, la racine sera toujours de la forme .
L'espace de nom dispose de nombreuses possibilités.
Parmi celles-ci :
Texte : urn:oasis:names:tc:opendocument:xmlns:text:1.0
Présentation : urn:oasis:names:tc:opendocument:xmlns:presentation:1.0
Feuille de style : urn:oasis:names:tc:opendocument:xmlns:style:1.0
Texte OOo : http://openoffice.org/2004/writer
Cette racine contient les éléments optionnels (macros), (polices utilisées) ou (styles internes), et l'élément requis , toujours en dernier.
Cet élément body voit son type défini par son premier sous-élément, par exemple .Un fichier content.xml classique pourra donc prendre la forme suivante :
Devinez ! Bonjour toute la Terre !
Les fichiers ODF sont donc, à tous les égards, respectueux des standards : entre les formats XML, Zip et PNG, rien n'est inaccessible aux développeurs souhaitant les exploiter pour des applications autres que la simple bureautique. Certains estiment d'ailleurs qu'il pourrait remplacer avantageusement le format PDF, voire le langage HTML, dès qu'il s'agit d'échanges d'informations.
De nombreux outils ou bibliothèque sont d'ailleurs déjà disponibles, dans plusieurs langages, pour autoriser la création et l'utilisation de ces formats. La plupart font appel à des fonctionnalités existantes, traitant les fichiers XML avec les balises adéquates.
A visiter : http://xmlfr.org/

PC-NTIC
"Un consultant NTIC à vos côtés !"

Aucun commentaire: