L'historique et l'origine du format PDF/A
PDF/A s'imposera sans aucun doute comme la solution standard d'archivage à long terme des documents électroniques. Il a été publié comme norme ISO le 1er octobre 2005 et a depuis commencé à conquérir le monde. En tant que représentant suisse au sein du comité ISO pour PDF/A, PDF Tools est votre point de contact compétent pour toutes les questions concernant PDF/A. Nous serons ravis de vous aider si vous ne trouvez pas les réponses à vos questions spécifiques sur ce site.
Introduction au PDF/A
Arrière-plan - ce qui est derrière PDF/A et d'où est-il venu
Le 28 septembre 2005, l'Organisation internationale de normalisation (ISO) a approuvé une nouvelle norme régissant l'archivage des documents électroniques:
ISO-19005-1 - Gestion des documents - Format électronique des documents pour la conservation à long terme - Partie 1 : Utilisation du PDF 1.4 (PDF/A-1).
La norme est le résultat de plus de 36 mois de collaboration entre les entreprises et les organisations du monde entier.
En mai 2002, l'Association pour la gestion de l'information et de l'image (AIIM), la National Printing Equipment Association (NPES) et l'organe administratif des tribunaux américains ont lancé une initiative pour la création de formats normalisés pour les documents archivés électroniquement. La réunion de lancement a eu lieu en octobre 2002. Les fabricants de PDF y ont assisté tels que Adobe Systems, Library of Congress, Surety Inc., Quality Associates Inc. Appligent, Merck, EMC, PDF Sages et NARA (National Archives and Records Administration). Xerox, Honeywell, EDS et Glaxo Smith Kline se sont joints plus tard, juste pour n'en nommer que quelques-uns.
Les fondateurs du projet ont élaboré une première version et soumis leur recommandation à l'ISO afin de la faire enregistrer comme norme internationale. L'ISO a assigné le projet au Comité technique TC 171 (Application de gestion de documents). TC 171 se compose de représentants de 13 pays membres (un vote chacun) ainsi que d'observateurs de 21 autres pays. Après de nombreux examens et améliorations, la norme a été acceptée en septembre 2005.
Pourquoi l'initiative PDF/A ?
Les formats d'archivage varient d'un pays à l'autre. Les méthodes d'archivage traditionnelles (papier, microfilm, microfiche), tout en garantissant la reproductibilité, ne sont plus conformes aux dernières technologies. Les documents de grande taille ne peuvent pas être expédiés rapidement dans le monde entier, et il est extrêmement difficile de rechercher des contenus spécifiques dans les documents archivés. De nombreuses organisations ont mis en place des archives TIFF comme première étape vers l'archivage électronique. Le TIFF garantit également la reproductibilité à long terme et est un format bien établi. Le TIFF peut maintenant être transmis rapidement et facilement dans les organisations connectées à l'échelle mondiale. Cependant, la recherche est encore difficile.
Le PDF a commencé à être pris en considération à ce stade. Un certain nombre de raisons rendent le PDF plus attractif que le TIFF :
PDF enregistre des objets structurés (comme des textes, des graphiques vectoriels, des images matricielles) qui permettent une recherche efficace dans toute l'archive. Le format TIFF, en revanche, est un format matriciel et doit être traité avec une machine OCR pour permettre une recherche en texte complet.
Les fichiers PDF sont plus compacts et nécessitent souvent une fraction de l'espace de stockage d'un fichier TIFF correspondant, souvent même avec une meilleure qualité. La petite taille des fichiers est particulièrement avantageuse pour l'échange électronique de données (FTP, pièces jointes de courriel, etc.).
Les métadonnées telles que le titre, l'auteur, la date de création et de modification, le contenu, les mots clés, etc. peuvent être intégrées directement dans le document PDF. Ainsi, elles peuvent être classées automatiquement sans aucune intervention humaine.
Le contenu de la page dans un document PDF est généralement indépendant de l'appareil, c'est-à-dire indépendant de la résolution du raster, du code couleur, etc. Les pages ne sont pas affichées sur le raster tant que la reproduction (processus de rendu). Les documents PDF bénéficient donc des progrès technologiques des équipements de sortie, tels que l'imprimante, le moniteur, etc. même des années plus tard.
Le créateur des normes de facto PDF, Adobe Systems, a publié au cours des treize dernières années huit nouvelles versions de son manuel de référence PDF. Chaque nouvelle version a élargi le format avec de nombreuses nouvelles fonctionnalités et modifié certaines des anciennes fonctionnalités. Il était donc nécessaire de développer un standard stable et reconnu au niveau international pour l'archivage à long terme, basé sur les spécifications PDF exclusives d'Adobe. Résultat: PDF/A.
Le standard PDF/A
Objectif du PDF/A
La norme ISO 19005 définit un format de fichier basé sur PDF appelé PDF/A. Le format offre un mécanisme qui représente les documents électroniques de telle sorte que l'apparence visuelle reste conservée pendant une période prolongée. indépendant des outils et des systèmes pour la production, l'épargne et la reproduction.
Cette norme ne spécifie ni les méthodes, ni l'intention ni le but de la préservation. La norme est donc destinée à garantir que les documents électroniques puissent être visualisés dans leur apparence originale, même à l'avenir. Pour cette raison, le document ne peut faire référence, indirectement ou directement, à aucune source externe. Un exemple serait une image externe ou une police qui n'est pas intégrée dans le document lui-même.
Comparaison entre PDF et PDF/A
Le format PDF normal ne garantit pas la reproductibilité à long terme ou l'indépendance complète par rapport au logiciel et au périphérique de sortie. Afin de garantir ces deux principes, il était nécessaire de limiter et d'étendre la spécification PDF existante. Dès le départ, il était clair que PDF/A-1 devait être basé sur une version existante de PDF afin d'obtenir l'acceptation d'un large public. Le comité de l'ISO TC 171 a choisi la référence Adobe PDF 1.4 comme base pour la norme PDF/A-1.
Le PDF Reference 1.4 a été implémenté par Adobe dans leur produit Acrobat 5. PDF/A-1, en tant que norme, doit satisfaire à toutes les exigences de ce document et doit également respecter certaines limites techniques d'Acrobat 5. La référence originale PDF et la norme ISO 19005-1 forment ensemble la norme PDF/A-1 actuelle. La norme ISO 19005-1 identifie uniquement les différences par rapport à la référence PDF. Par conséquent, PDF Reference 1.4 est la base centrale pour comprendre la norme PDF/A-1.
Plusieurs fonctions PDF 1.4, telles que la transparence ou la reproduction de l'audio et de la vidéo, sont interdites dans la norme PDF/A-1. Certaines options du PDF 1.4 sont obligatoires dans PDF/A-1, par exemple, toutes les polices utilisées doivent être intégrées dans le document. Essentiellement, la norme PDF/A-1 ne fait rien d'autre que d'identifier spécifiquement les caractéristiques individuelles de PDF Reference 1. et pour indiquer si chacun est absolument nécessaire, recommandé, limité ou non autorisé.
Le PDF/A, A-1a, A-1b, A-2 "Babylone"
La norme PDF/A-1 est divisée en deux niveaux de conformité : PDF/A-1a et PDF/A-1b.
PDF/A-1a (niveau A) définit la conformité à toutes les exigences de la norme PDF/A-1.
Les exigences minimales de conformité avec PDF/A-1 sont contenues dans PDF/A-1b (niveau B Conformance). Les exigences du PDF/A-1b sont généralement suffisantes pour une reproduction sans équivoque sur une période prolongée.
PDF/A-1a diffère de PDF/A-1b principalement en ce qui concerne les exigences en matière d'accessibilité (paragraphe 508 de la loi américaine sur la réhabilitation).
PDF/A-1a garantit que le texte du document est extractible et que la structure logique du document ainsi que le processus naturel de lecture du texte intégré restent intacts. L'extraction de texte est principalement intéressante si les documents doivent être affichés sur les appareils mobiles (e. ) ou visualisé au sens du paragraphe 508 de la loi américaine sur la réhabilitation. Cela inclut l’exigence que la représentation du texte s’adapte à l’écran réduit en étant restructurée (refloit). Cette fonctionnalité est également connue sous le nom de PDF étiqueté.
PDF/A-1b garantit que le texte et les autres contenus des pages sont reproduits uniformément ; il ne garantit toutefois pas que le texte incorporé soit compréhensible et lisible par les machines. Le créateur d'un fichier PDF/A-1b est libre d'intégrer le texte dans une forme lisible, même si les exigences les plus strictes en vertu de la section 508 susmentionnée ne sont pas respectées.
Pour les documents numérisés, la conformité avec PDF/A-1b est tout à fait suffisante, même s'ils ont été traités à l'aide de la ROC pour permettre une recherche en texte intégral.
En juillet 2011, le Comité Technique a publié une nouvelle partie de la norme : ISO 19005-2 (PDF/A-2). Lorsque PDF/A-1 est basé sur PDF version 1. , PDF/A-2 profite des fonctionnalités qui ne sont disponibles que dans les versions ultérieures de PDF, jusqu'à la version 1.7 de PDF. Mais plus important encore, PDF/A-2 n'est plus basé sur une version Adobe PDF, mais est maintenant basé sur la norme ISO 32000-1.
Le Comité ISO a publié la troisième édition de la norme (ISO 19005-3) en octobre 2012. PDF/A-3 ne contient qu'un seul changement qui est nécessaire mais controversé: PDF/A-2 a déjà permis d'intégrer des documents PDF/A-conformes en tant que pièces jointes. Toutefois, PDF/A-3 permet d'intégrer pour la première fois tous les formats de document tels que les fichiers Excel, Word, HTML, CAD ou XML.
Utilisation du standard PDF/A
Comment puis-je obtenir une copie ?
La norme PDF/A ISO 19005 peut être achetée sur le site Internet de l'ISO. Des copies peuvent être commandées sur papier ou électroniquement en format PDF et, comme toutes les autres normes ISO, sont protégées par le droit d'auteur. Il est donc illégal de proposer des copies gratuites via Internet. La norme est actuellement disponible en anglais seulement.
Qui devrait lire la norme?
Le but de la norme PDF/A est de soutenir et d'améliorer les stratégies d'archivage. Le standard lui-même est de nature assez technique et ne peut être compris que par des experts ayant une connaissance approfondie des langues de description de la page comme PostScript et PDF. Le document principal en lui-même est petit, mais la portée du document de base est très grande. Le PDF Référence 1. à elle seule contient 1 000 pages, sans inclure les documents référencés (formats de police et de compression, spécifications XML, profils couleur ICC, signatures numériques, RFC, etc.).
En outre, la seule norme ne garantit pas la conservation à long terme. Il est recommandé de consulter un expert pour bien comprendre les exigences PDF/A mettre en œuvre une politique d'archivage à l'échelle de l'entreprise et atteindre les objectifs à long terme de l'archivage des documents.
Quels sont les outils disponibles?
Des outils de création, de traitement et de validation de documents PDF sont disponibles sur le marché depuis la mi-2006. Adobe lui-même a intégré les fonctionnalités correspondantes dans la version 8 d'Adobe Acrobat, sortie à l'automne 2006. Microsoft fournit également un plug-in téléchargeable séparément pour Office 2007 qui permet la création de fichiers PDF/A conformes directement à partir de produits Office. Compte tenu du nombre de produits pour la création de PDF/A déjà sur le marché, Il est désormais très important de tester chaque document PDF/A créé en fonction de la conformité PDF/A appropriée.
PDF/A requiert une solution globale
La norme PDF/A n'est qu'une composante d'une solution globale. À elle seule, PDF/A ne garantit pas la conservation à long terme ou que les fonctions d'affichage telles que prévues. De même, PDF/A ne prétend pas être la solution la plus appropriée dans chaque scénario. Par contre, PDF/A définit les exigences spécifiques pour les documents électroniques afin de les conserver à long terme.
D'autres aspects doivent être pris en compte si une archive conforme au format PDF/A doit être implémentée. Celles-ci comprennent, entre autres, des normes et des processus internes de l'entreprise, une gestion de la qualité, des sources de données fiables et des exigences spécifiques adaptées à l'objectif spécifique de l'application. En particulier, la migration des archives papier ou TIFF vers une archive conforme au format PDF/A n'est pas une tâche insignifiante, et doit donc être planifié avec soin.
PDF/A summary
PDF/A comme nouveau standard d'archivage
PDF/A devrait devenir la nouvelle norme d'archivage des documents électroniques. Le format PDF est omniprésent dans les secteurs privé et public du monde entier et est déjà accepté comme format pour d'innombrables fins. La norme PDF/A permettra de s'assurer que les utilisateurs seront en mesure de reproduire les documents en toute sécurité, même après une longue période.
L'introduction de la norme PDF/A influencera probablement le développement futur de PDF lui-même. Indépendamment de cela, Adobe continuera avec des améliorations et l'introduction de nouvelles fonctionnalités. Des exemples incluent des modèles 3-D ou XFA pour des formulaires PDF dynamiques. Cela fera encore pression sur la norme, parce que l'essence d'un standard - en particulier un standard d'archivage - est qu'il n'est pas fréquemment modifié.
Comment le marché réagira-t-il ?
Nous ne devrions pas nous attendre à ce que les produits PDF/A inondent le marché. Il faut des connaissances considérables pour comprendre la technologie derrière PDF/A. De plus, l'utilisateur a des exigences de qualité plus élevées avec des logiciels conformes aux normes.
Les premiers outils sont apparus sur le marché au milieu de 2006. A la demande sont des documents PDF/A conformes à la production, la validation PDF/A ainsi qu'une simple conversion des documents PDF existants en fichiers PDF/A.
L'apparition des premiers outils professionnels PDF/A a déjà déclenché des processus pour l'implémentation de systèmes d'archivage conformes à la norme PDF/A. Il ne faut pas s'attendre à trop de fonctionnalités à ce stade. Il est probable que dans un premier temps, seuls les PDF/A-1b limités seront proposés, et que le PDF/A-1a complet ne sera disponible que plus tard.
Comme c'est souvent le cas lors de l'introduction d'une nouvelle norme, de nombreux produits seront diffusés sur le marché qui annoncent la conformité PDF/A mais qui ne répondent pas aux exigences de la norme. Les experts en évaluation et les fournisseurs réputés sont particulièrement demandés durant la phase de lancement.
L'air chaud ou la stratégie à long terme?
PDF/A ne sera pas de courte durée. La nécessité d'un cadre standardisé pour l'archivage au format PDF existe depuis plusieurs années. Et : le PDF est déjà utilisé à cette fin dans de nombreuses applications, avec l'aide de politiques spécifiques à l'entreprise.
Le fait que Microsoft réponde à la demande du client en permettant de créer des documents PDF/A directement à partir de la plus récente palette Office est un signal clair. Accepté internationalement, PDF/A est là pour rester.