Le PDF – nous ne pouvons pas nous en passer
Tous les formats de documents ne sont pas parvenus à devenir une norme et ne sont pas près de tenir leurs promesses. Alors, que pouvons-nous ou devons-nous attendre d'un format? Quelles sont les caractéristiques de qualité les plus importantes d’un format et comment savoir si un format est « bon » ? Où se trouvent les dangers et comment les éviter? Le choix du format est très important, en particulier dans le domaine de l'archivage à long terme. Les documents archivés depuis plusieurs années dans un format inadapté ou en mauvaise qualité peuvent avoir de graves conséquences.
Source d'origine
Normes PDF et ISO
En ce qui concerne l'archivage, un format se distingue du reste : PDF, le format natif d'Adobe Acrobat. Conçu à l'origine pour l'échange de documents indépendamment de la plate-forme ou du logiciel, PDF s'est solidement établi au cours des 21 dernières années et est maintenant implémenté par presque tous les logiciels qui génèrent des documents électroniques. Mais l'utilisation croissante de PDF a également fait craindre une dépendance à l'égard d'Adobe. Pour surmonter ceci, Adobe et certains utilisateurs et entreprises industrielles se sont engagés à faire de PDF la norme de l'industrie et à la développer par le biais des cartes ISO. Le premier résultat de cette initiative a été la publication de la norme ISO 32000-1 en 2008, sur la base de la version PDF 1.7 d’Adobe. L'ISO travaille actuellement sur la version PDF 2.0.
La gamme de fonctions de PDF, qui s’est considérablement développée au fil des ans, n’est pas adaptée ou nécessaire à tous les domaines d’application. C'est pourquoi ISO a développé un certain nombre de sous-standards basés sur la norme PDF et spécifiquement adaptés aux applications les plus importantes.
Les normes PDF/X, PDF/A, PDF/E, PDF/VT et PDF/UA ne sont pas des formats de fichiers séparés. Au lieu de cela, ils sont basés sur la norme PDF1.7 prépondérante, définissant les exigences et les interdictions pour l’utilisation prévue dans chaque cas. Ces règles limitent la plage de fonctions du PDF 1.1 et forment un sous-ensemble défini.
PDF pour l'archivage électronique à long terme
Bien que le PDF ait été développé pour l’échange de documents indépendamment du système d’exploitation ou du logiciel du créateur ou du visualisateur, le format seul n'est pas adapté à l'archivage. C'est pourquoi PDF/A a été développé.
PDF/A est le nom donné à une série de normes qui décrivent les caractéristiques des fichiers PDF pour l'archivage électronique à long terme des documents. L'objectif des normes est de s'assurer que les documents archivés restent accessibles à long terme et qu'ils s'autodocumentent, sans ambiguïté, interrogeable, et décrite avec les métadonnées. Pour ces raisons, le cryptage est interdit, les polices et les profils de couleurs doivent être intégrés, les contenus alternatifs et dynamiques doivent être supprimés et les références au contenu externe doivent être supprimées.
Un fichier PDF peut également correspondre à plusieurs sous-standards en même temps. Ceci est particulièrement important lors de l'archivage des fichiers PDF/X et PDF/VT-conformes aux normes PDF/A. La gamme de fonctions d'un dossier qui exige la conformité à plusieurs normes sera donc limitée au nombre de fonctions offertes par les normes individuelles.
Format vs. format
PDF est un format très capable, mais en aucun cas un allrounder. Un grand nombre de formats ont été optimisés pour des utilisations spécifiques (voir Fig. 3).
Quand il s'agit de décrire les avantages et les inconvénients des formats de fichiers, De nombreux auteurs se tournent automatiquement vers PDF et publient des comparaisons informées – et parfois moins informées – entre ces formats et PDF. Toutefois, pour rendre la comparaison aussi juste que possible, nous ne devons pas perdre de vue l'utilisation prévue. Les comparaisons n'ont de sens que si les domaines d'application se chevauchent, ce qui nous amène dans les domaines les plus discutés.
Courriel entrant
En ce qui concerne les images dans les documents numérisés, TIFF n'est ni meilleur ni pire que le PDF. Les avantages du PDF ne sont visibles que s'il y a des exigences supplémentaires qui vont au-delà de la simple représentation de la page. De plus, une archive TIFF ne devrait pas être migrée aveuglément vers une archive PDF si aucune valeur ajoutée ne compense l'effort. Les critères pour une migration du TIFF vers le PDF sont indiqués dans la Fig. 4.
Documents de travail
Les formats Office sont utilisés le plus souvent pour les documents de travail. OOXML est le format natif de Word, Excel et PowerPoint. Cependant, il n'est pas possible de faire une comparaison équitable entre OOXML et PDF. OOXML a été conçu pour créer et éditer des documents. Il contient des informations sur la structure et met du texte lisible (copier/coller). Décrire le PDF comme un format d'auteur ou même comme adapté à l'édition serait plutôt audacieux. D'un autre côté, en tant que format PDF, les scores sont élevés avec sa mise en page fixe et son aptitude à l'archivage, dont OOXML ne convient absolument pas, même si certains utilisateurs le souhaitent.
Les sous-ensembles XPS et PDF/A sont cependant comparables et ont beaucoup de choses en commun, comme le contenu statique. Le but du développement de XPS était d'éliminer les incompatibilités entre le format du document et le système d'exploitation. Par exemple, le modèle graphique XPS est le même que le nouveau sous-système graphique WPF de Vista. Plus précisément, les éléments XPS sont un sous-ensemble de XAML, le langage de description des documents et des interfaces utilisateur contenus dans WPF.
Cet exemple montre en particulier l'importance de la dispersion d'un format. PDF/A est maintenant la norme de fait pour l'archivage ; en revanche, XPS est presque inconnu. Des conclusions similaires peuvent être tirées sur le format ODF indépendant de Microsoft Office .
Courrier sortant
Les flux de données imprimés au format PostScript, PCL et AFP sont parfois archivés directement, mais plus généralement après la conversion en TIFF (COLD). Au cours des dernières années, il a été question de remplacer le «tiffing», comme on le connaît parfois, par la conversion PDF/A. Les critères tels que la taille de fichier (nécessaire pour intégrer les polices), l'effort de conversion et la qualité finale jouent un rôle important. Il n'y a pas de standard d'archivage pour PostScript et PCL, mais des travaux sont actuellement en cours sur un standard AFP/A comme alternative à PDF/A.
Ces considérations sont particulièrement pertinentes pour les entreprises qui souhaitent mettre en œuvre leur propre solution d'archivage pour le courrier sortant. Si une solution d'archivage à l'échelle de l'entreprise est préférée, alors PDF/A est généralement le choix évident.
Formats de fichiers
TIFF: Échanger le format pour les images matricielles (numérisation, archivage)
PostScript/PCL: Langue de description de la page pour l'impression
PDF : Échange de documents avec mise en page fixe et éléments interactifs
AFP: Impression transactionnelle avec données variables
Formats de bureau: format propriétaire pour les documents de travail au sein de l'entreprise
OOXML: Format XML Open Office de Microsoft
ODF : Format Open Office en concurrence avec Microsoft
XML: Stockage de données orientées objet avec référence à un schéma
XMP : format de métadonnées extensible basé sur
XPS : langage de description de page XML de Microsoft
EPUB : Format pour la publication de documents en ligne
PRC : Stockage des données et des attributs 3D
Multimédia : De nombreux formats pour le streaming audio et vidéo
Données 3D pour l'ingénierie
Une norme ISO appelée PRC (Product Representation Compact)est disponible pour les données 3D qui peuvent être manipulées interactivement et sont enrichies de descriptions (par exemple les listes de pièces). La PRC peut être intégrée en PDF et constitue une caractéristique importante de la norme PDF/E. PDF/E-2 est conçu de manière à permettre l'archivage direct des fichiers conformes.
Métadonnées
Il existe de nombreux formats propriétaires pour les métadonnées et souvent ils sont stockés directement dans le système d'archives. Cependant, il est fortement recommandé d'utiliser un format standard. L'ISO offre XMP (Extensible Metadata Platform), qui est basé sur XML; il peut être intégré dans presque n'importe quel format d'image (e. JPEG et TIFF) et est une composante importante de PDF/A. En outre, les données XML peuvent être intégrées directement dans PDF/A-3, comme pour la facturation électronique (ZUGFeRD).
Multimédia
Les fichiers audio et vidéo peuvent également être archivés, bien sûr, soit individuellement, soit en tant que flux de données embarqués en format PDF et autres. Cependant, aucune norme généralement reconnue pour ces formats n'existe à l'heure actuelle Bien que cela puisse changer à l'avenir avec l'EPUB, un format utilisé pour la publication électronique, jouant un rôle moteur.
Archivage – est-ce que PDF/A est la solution?
Dans un monde de documents électroniques, PDF/A est certain qu'il satisfera à la plupart des exigences de format de fichier. Mais cela ne s'applique en aucun cas à tous les documents archivés. Pour les outils de communication interactifs en particulier, tels que les sites Web, les programmes et le contenu multimédia, de nouvelles normes sont nécessaires. Les experts de la norme ISO ne seront donc pas à court de travail dans les plus brefs délais.