Die Geschichte und der Ursprung des Formats PDF/A
PDF/A wird sich zweifellos als der Standard für die langfristige Archivierung elektronischer Dokumente etablieren. Es wurde am 1. Oktober 2005 als ISO-Norm veröffentlicht und hat seitdem die Welt erobert. Als Schweizer Vertreter im ISO-Ausschuss für PDF/A ist PDF Tools Ihr kompetenter Ansprechpartner für alle Fragen rund um PDF/A. Wir helfen Ihnen gerne weiter, wenn Sie die Antworten auf Ihre speziellen Fragen auf dieser Website nicht finden.
Einführung in PDF/A
Hintergrund – was steckt hinter PDF/A und woher stammt es
Am 28. September 2005 genehmigte die International Organization for Standardization (ISO) einen neuen Standard für die Archivierung elektronischer Dokumente:
ISO-19005-1 - Dokumentenverwaltung - Elektronisches Dokumenten-Dateiformat zur langfristigen Archivierung - Teil 1: Verwendung von PDF 1.4 (PDF/A-1).
Der Standard war das Ergebnis von mehr als 36 Monaten Zusammenarbeit von Unternehmen und Organisationen aus der ganzen Welt.
Im Mai 2002 starteten die Association for Information and Image Management (AIIM), die National Printing Equipment Association (NPES) und die Verwaltungsbehörde für die US-Gerichte eine Initiative zur Schaffung standardisierter Formate für elektronisch archivierte Dokumente. Das erste Treffen fand im Oktober 2002 statt. Es wurde von PDF-Herstellern wie Adobe Systems, Library of Congress, Surety Inc., Quality Associates Inc., Appligent, Merck, EMC, PDF Sages und NARA (National Archives and Records Administration) besucht. Xerox, Honeywell, EDS und Glaxo Smith Kline schlossen sich später auch an, um nur einige zu nennen.
Die Gründer des Projekts stellten eine erste Version zusammen und reichten ihre Empfehlung bei der ISO ein, um sie als internationalen Standard registrieren zu lassen. Die ISO beauftragte das Projekt mit dem Technischen Komitee TC 171 (Anwendungen zur Dokumentenverwaltung). TC 171 besteht aus Vertretern von 13 Mitgliedsländern (jeweils eine Stimme) sowie Beobachtern aus weiteren 21 Ländern. Nach zahlreichen Überprüfungen und Verbesserungen wurde der Standard im September 2005 akzeptiert.
Warum die PDF/A-Initiative?
Archivierungsformate variieren von Land zu Land. Traditionelle Archivierungsmethoden (Papier, Mikrofilm, Mikrofiche) gewährleisten zwar die Reproduzierbarkeit, entsprechen jedoch nicht mehr der neuesten Technologie. Große Dokumente können nicht schnell um die Welt verschickt werden, und es ist äußerst schwierig, in den archivierten Dokumenten nach bestimmten Inhalten zu suchen. Viele Organisationen richteten TIFF-Archive als ersten Schritt in Richtung elektronische Archivierung ein. TIFF gewährleistet ebenfalls die langfristige Reproduzierbarkeit und ist ein etablierter Standard. TIFF kann nun weltweit schnell und einfach übertragen werden; die Suche bleibt jedoch weiterhin schwierig.
PDF begann in diesem Punkt an Bedeutung zu gewinnen. Eine Reihe von Gründen macht PDF attraktiver als TIFF:
PDF speichert strukturierte Objekte (wie Texte, Vektorgrafiken, Rasterbilder), die eine effiziente Suche im gesamten Archiv unterstützen. TIFF hingegen ist ein Rasterformat und muss mit einer OCR-Maschine verarbeitet werden, um eine Volltextsuche zu ermöglichen.
PDF-Dateien sind kompakter und benötigen oft nur einen Bruchteil des Speicherplatzes einer entsprechenden TIFF-Datei, häufig sogar bei besserer Qualität. Die kleine Dateigröße ist besonders vorteilhaft für den elektronischen Datenaustausch (FTP, E-Mail-Anhänge usw.).
Metadaten wie Titel, Autor, Erstellungs- und Änderungsdatum, Inhalt, Schlüsselwörter usw. können direkt im PDF-Dokument eingebettet werden. So können sie automatisch ohne menschliches Eingreifen klassifiziert werden.
Die Seiteninhalte in einem PDF-Dokument sind in der Regel geräteunabhängig, d.h. unabhängig von der Rasterauflösung, Farbcode usw. Die Seiten werden erst beim Reproduzieren (Rendern) auf dem Raster angezeigt. PDF-Dokumente profitieren daher von den technologischen Fortschritten der Ausgabegeräte, wie z.B. Drucker, Monitor usw. sogar Jahre später.
Der Ersteller des PDF-De-facto-Standards, Adobe Systems, hat in den letzten dreizehn Jahren acht neue Versionen seines „PDF Reference Manual“ veröffentlicht. Jede neue Version erweiterte das Format um zahlreiche neue Funktionen und modifizierte einige der alten Funktionen. Es war daher notwendig, einen stabilen, international anerkannten Standard für die langfristige Archivierung zu entwickeln, der auf den proprietären PDF-Spezifikationen von Adobe basiert. Das Ergebnis: PDF/A.
Der PDF/A-Standard
Zweck von PDF/A
Der ISO-Standard 19005 definiert ein auf PDF basierendes Datei-Format namens PDF/A. Das Format bietet einen Mechanismus, der elektronische Dokumente so darstellt, dass das visuelle Erscheinungsbild über einen längeren Zeitraum erhalten bleibt, unabhängig von Werkzeugen und Systemen zur Herstellung, Speicherung und Wiederherstellung.
Dieser Standard spezifiziert weder die Methoden noch die Absicht noch den Zweck der Erhaltung. Der Standard soll somit garantieren, dass elektronische Dokumente auch in Zukunft in ihrem ursprünglichen Erscheinungsbild angezeigt werden können. Aus diesem Grund darf das Dokument weder indirekt noch direkt auf externe Quellen verweisen. Ein Beispiel wäre ein externes Bild oder eine Schriftart, die nicht im Dokument eingebettet ist.
Vergleich zwischen PDF und PDF/A
Das normale PDF-Format garantiert nicht die langfristige Reproduzierbarkeit oder die vollständige Unabhängigkeit von Software und Ausgabegerät. Um beide Prinzipien sicherzustellen, war es notwendig, die bestehende PDF-Spezifikation sowohl zu beschränken als auch zu erweitern. Von Anfang an war klar, dass PDF/A-1 auf einer bestehenden Version von PDF basieren musste, um die Akzeptanz eines breiten Publikums zu erreichen. Das ISO-Komitee TC 171 wählte die Adobe PDF Reference 1.4 als Grundlage für den PDF/A-1-Standard.
Die PDF Reference 1.4 wurde von Adobe in ihrem Produkt Acrobat 5 implementiert. PDF/A-1 muss als Norm alle Anforderungen dieses Dokuments erfüllen und auch bestimmte technische Einschränkungen von Acrobat 5 respektieren. Die Original-PDF-Referenz und die ISO 19005-1 bilden zusammen den aktuellen PDF/A-1-Standard. ISO 19005-1 identifiziert nur die Unterschiede zur PDF-Referenz. Daher ist die PDF Reference 1.4 die zentrale Grundlage, um den PDF/A-1-Standard zu verstehen.
Mehrere PDF-1.4-Funktionen, wie Transparenz oder die Wiedergabe von Audio und Video, sind im PDF/A-1-Standard verboten. Einige Optionen von PDF 1.4 sind in PDF/A-1 zwingend erforderlich: Beispielsweise müssen alle verwendeten Schriftarten im Dokument eingebettet sein. Im Wesentlichen tut der PDF/A-1-Standard nichts anderes, als individualisierte Merkmale der PDF Referenz 1.4 spezifisch zu identifizieren und anzugeben, ob jedes absolut notwendig, empfohlen, eingeschränkt oder nicht erlaubt ist.
Der PDF/A, A-1a, A-1b, A-2 "Babylon"
Der PDF/A-1-Standard ist in zwei Konformitätsstufen unterteilt: PDF/A-1a und PDF/A-1b.
PDF/A-1a (Stufe A-Konformität) definiert die Konformität mit allen Anforderungen der PDF/A-1-Norm.
Die Mindestanforderungen für die Konformität mit PDF/A-1 sind in PDF/A-1b (Stufe B-Konformität) enthalten. Die Anforderungen von PDF/A-1b sind im Allgemeinen ausreichend für eine eindeutige Reproduktion über einen längeren Zeitraum.
PDF/A-1a unterscheidet sich hauptsächlich in Bezug auf die Anforderungen an die Barrierefreiheit (Paragraph 508 des US-Rehabilitationsgesetzes).
PDF/A-1a garantiert, dass der Dokumenttext extrahierbar ist und dass die logische Struktur des Dokuments sowie der natürliche Leseprozess des integrierten Textmaterials intakt bleiben. Die Textextraktion ist hauptsächlich von Interesse, wenn Dokumente auf mobilen Geräten (z. B. PDA) angezeigt oder im Sinne von Paragraph 508 des US-Rehabilitationsgesetzes visualisiert werden sollen. Dazu gehört die Anforderung, dass die Textdarstellung auf dem reduzierten Bildschirm durch Umstrukturierung (Re-Flow) angepasst werden muss. Diese Funktionalität ist auch als Tagged PDF bekannt.
PDF/A-1b stellt sicher, dass Text und andere Inhalte auf den Seiten einheitlich wiedergegeben werden; garantiert jedoch nicht, dass der eingebettete Text verständlich und maschinenlesbar ist. Der Ersteller einer PDF/A-1b-konformen Datei ist frei, den Text in einer lesbaren Form einzubetten, auch wenn die strengeren Anforderungen gemäß dem oben genannten Abschnitt 508 nicht erfüllt sind.
Für gescannte Dokumente reicht die Konformität mit PDF/A-1b völlig aus, auch wenn sie mit OCR verarbeitet wurden, um eine Volltextsuche zu ermöglichen.
Im Juli 2011 veröffentlichte das Technische Komitee einen neuen Teil des Standards: ISO 19005-2 (PDF/A-2). Während PDF/A-1 auf PDF-Version 1.4 basiert, nutzt PDF/A-2 Funktionen, die erst in späteren Versionen von PDF verfügbar wurden, einschließlich PDF-Version 1.7. Vor allem jedoch basiert PDF/A-2 nicht mehr auf einer bestimmten Adobe PDF-Version, sondern wird jetzt auf dem ISO-Standard 32000-1 basieren.
Das ISO-Komitee veröffentlichte im Oktober 2012 die dritte Ausgabe des Standards (ISO 19005-3). PDF/A-3 enthält nur eine notwendige, aber kontroverse Änderung: PDF/A-2 ermöglichte bereits das Einbetten von PDF/A-konformen Dokumenten als Anhänge. PDF/A-3 ermöglicht jedoch erstmals das Einbetten von Dokumentformaten wie Excel, Word, HTML, CAD oder XML-Dateien.
Verwendung des PDF/A-Standards
Wie bekomme ich eine Kopie?
Der PDF/A-Standard ISO 19005 kann auf der ISO-Website erworben werden. Kopien können auf Papier oder elektronisch im PDF-Format bestellt werden und sind, wie alle anderen ISO-Normen, urheberrechtlich geschützt. Es ist daher illegal, kostenlose Kopien über das Internet anzubieten. Der Standard ist derzeit nur in Englisch verfügbar.
Wer sollte den Standard lesen?
Der Zweck des PDF/A-Standards ist es, Archivierungsstrategien zu unterstützen und zu verbessern. Der Standard selbst ist recht technisch und kann nur von Experten mit umfangreichem Wissen über Seitenbeschreibungssprachen, wie PostScript und PDF, verstanden werden. Das Hauptdokument selbst ist klein, jedoch ist der Umfang des Basisdokuments sehr groß. Die PDF-Referenz 1.4 allein umfasst <b>1.000</b> Seiten, ohne die referenzierten Dokumente (Schriftarten- und Komprimierungsformate, XML-Spezifikationen, ICC-Farbprofile, digitale Signaturen, RFCs usw.).
Darüber hinaus garantiert allein der Standard keine langfristige Erhaltung. Es ist empfehlenswert, einen Experten zu konsultieren, um die PDF/A-Anforderungen vollständig zu verstehen, eine unternehmensweite Archivierungsrichtlinie zu implementieren und die langfristigen Ziele der Dokumentenarchivierung zu erreichen.
Welche Tools sind verfügbar?
Tools zum Erstellen, Verarbeiten und Validieren von PDF-Dokumenten sind seit Mitte 2006 auf dem Markt verfügbar. Adobe selbst integrierte entsprechende Funktionen in Version 8 von Adobe Acrobat, die im Herbst 2006 veröffentlicht wurde. Microsoft bietet auch ein separat herunterladbares Plug-in für Office 2007 an, das die Erstellung von PDF/A-konformen Dateien direkt aus Office-Produkten ermöglicht. Angesichts der Anzahl von Produkten zur Erstellung von PDF/A, die bereits auf dem Markt sind, ist es jetzt sehr wichtig, jedes erstellte PDF/A-Dokument hinsichtlich der ordnungsgemäßen PDF/A-Konformität zu testen.
PDF/A erfordert eine umfassende Lösung
Der PDF/A-Standard ist nur ein Bestandteil einer umfassenden Lösung. PDF/A allein garantiert keine langfristige Erhaltung oder dass die Anzeige wie vorgesehen funktioniert. Ebenso beansprucht PDF/A nicht, die geeignetste Lösung in jedem Szenario zu sein. Andererseits definiert PDF/A die spezifischen Anforderungen an elektronische Dokumente, damit sie langfristig erhalten bleiben können.
Andere Aspekte müssen berücksichtigt werden, wenn ein PDF/A-konformes Archiv implementiert werden soll. Dazu gehören unter anderem unternehmensinternen Standards und Prozesse, Qualitätsmanagement, zuverlässige Datenquellen und spezifische Anforderungen, die auf den bestimmten Anwendungszweck zugeschnitten sind. Insbesondere die Migration bestehender Papier- oder TIFF-Archive in ein PDF/A-konformes Archiv ist keine unbedeutende Aufgabe und muss daher sorgfältig geplant werden.
PDF/A-Zusammenfassung
PDF/A als neuer Archivierungsstandard
Es wird erwartet, dass PDF/A der neue Standard für die Archivierung elektronischer Dokumente wird. PDF ist weltweit in privaten und öffentlichen Sektoren allgegenwärtig und bereits als Format für unzählige Zwecke akzeptiert. Der PDF/A-Standard wird dazu beitragen, dass die Benutzer Dokumente auch nach langer Zeit sicher reproduzieren können.
Die Einführung des PDF/A-Standards wird (wie sie sollte) wahrscheinlich die zukünftige Entwicklung von PDF selbst beeinflussen. Unabhängig davon wird Adobe weiterhin Verbesserungen und die Einführung neuer Funktionen vorantreiben. Beispiele sind <b>3</b>D-Modelle oder XFA für dynamische PDF-Formulare. Dies wird weiteren Druck auf den Standard ausüben, da das Wesen eines Standards - insbesondere eines Archivierungsstandards - darin besteht, dass er nicht häufig modifiziert wird.
Wie wird der Markt reagieren?
Wir sollten nicht erwarten, dass PDF/A-Produkte den Markt überschwemmen. Es bedarf beträchtlicher Kenntnisse, um die Technologie hinter PDF/A zu verstehen. Darüber hinaus hat der Nutzer höhere Qualitätsanforderungen an standardkonforme Software.
Die ersten Tools erschienen Mitte 2006 auf dem Markt. Nachgefragt sind PDF/A-konforme Produktion, PDF/A-Validierung sowie eine einfache Umwandlung bestehender PDF-Dokumente in konforme PDF/A-Dateien.
Das Erscheinen der ersten professionellen PDF/A-Tools hat bereits Prozesse für die Implementierung von PDF/A-konformen Archivs ausgelöst. Es sollte nicht erwartet werden, dass an diesem Punkt zu viel Funktionalität zu erwarten ist. Es ist wahrscheinlich, dass zunächst nur die eingeschränkten PDF/A-1b angeboten werden, und das vollständige PDF/A-1a erst später.
Wie so oft, wenn ein neuer Standard eingeführt wird, werden viele Produkte auf den Markt gebracht, die PDF/A-Konformität bewerben, aber tatsächlich die Anforderungen des Standards nicht erfüllen. Expertise für die Bewertung und seriöse Anbieter sind besonders in der Einführungsphase gefragt.
Heißer Wind oder langfristige Strategie?
PDF/A wird nicht von kurzer Dauer sein. Der Bedarf an einem standardisierten Rahmen für die Archivierung mit PDF besteht seit mehreren Jahren. Und: PDF wird bereits zu diesem Zweck in vielen Anwendungen eingesetzt, mit Hilfe unternehmensspezifischer Richtlinien.
Die Tatsache, dass Microsoft auf die Kundenanforderung reagiert, indem es die Möglichkeit schafft, PDF/A-Dokumente direkt aus der neuesten Office-Palette zu erstellen, ist ein deutliches Signal. International akzeptiert, bleibt PDF/A hier.