Alles über PDF/A für die langfristige Archivierung
PDF/A ist der Standard für die Archivierung elektronischer Dokumente. Das PDF-Format ist weltweit verbreitet. Es wird für eine Vielzahl von Zwecken in der Industrie, im öffentlichen und im privaten Sektor verwendet. Der PDF/A-Standard ist das perfekte Instrument, um die Erhaltung und Reproduzierbarkeit von Dokumenten über längere Zeiträume hinweg zu gewährleisten.
Was ist PDF/A?
PDF/A ist ein Format, das die Anforderungen für die langfristige Archivierung erfüllt. Es vereint die Vorteile des PDF-Formats mit anderen spezifischen Anforderungen für die langfristige Archivierung.
Die ISO-Norm 19005 definiert ein Dateiformat, das auf PDF basiert und PDF/A genannt wird. Das Format bietet das Prinzip eines eigenständigen Dokuments. Das bedeutet, dass das visuelle Erscheinungsbild eines Dokuments über einen längeren Zeitraum erhalten bleibt, unabhängig von den Werkzeugen und Systemen, die zu seiner Erstellung, Speicherung und Wiedergabe verwendet werden.
Dieser Standard legt weder die Methoden noch die Absicht oder das Ziel der Erhaltung fest. Der Standard soll somit gewährleisten, dass elektronische Dokumente auch in Zukunft in ihrem ursprünglichen Erscheinungsbild angezeigt werden können.
Aus diesem Grund darf das Dokument weder indirekt noch direkt auf eine externe Quelle verweisen, zum Beispiel auf ein externes Bild oder eine nicht in das Dokument eingebettete Schriftart.
Der PDF/A-Standard ist ein Regelwerk, das definiert, welche Kriterien ein Dokument erfüllen muss, um PDF/A-konform zu sein. Er ist in seinem Umfang eingeschränkter als PDF, da PDF selbst bereits der zugrunde liegende Standard ist.
Was ist der Unterschied zwischen PDF und PDF/A?
Das normale PDF-Format garantiert nicht die langfristige Reproduzierbarkeit oder vollständige Unabhängigkeit von der Software und dem Ausgabegerät. Um beide Prinzipien zu garantieren, war es notwendig, die bestehende PDF-Spezifikation sowohl zu limitieren als auch zu erweitern. Von Anfang an war klar, dass PDF/A auf einer vorhandenen Version von PDF basieren musste, um die Akzeptanz eines breiten Publikums zu erreichen.
Adobes PDF-Referenz <b>1.4</b> (Acrobat 5) bildet die Grundlage für den PDF/A-Standard (ISO 19005). Es heißt, dass PDF/A „alle Anforderungen der PDF-Referenz erfüllen muss, die zusätzlich diesen Teil der ISO 19005-Norm umfasst“. Mit anderen Worten, der Standard beschreibt nur die Unterschiede zur Referenz.
Bestimmte Funktionen, die von PDF <b>1,4</b> unterstützt werden, wie Transparenz oder Audio-/Video-Wiedergabe, wurden von PDF/A ausgeschlossen. Gleichzeitig beschreibt PDF <b>1,4</b> optionale Elemente, die in PDF/A verbindlich sind. Zum Beispiel müssen alle sichtbar verwendeten Schriftarten in PDF/A eingebettet sein.
Kurz gesagt, PDF/A definiert hauptsächlich die spezifischen Eigenschaften, die in der PDF-Referenz <b>1,4</b> festgelegt sind und die verbindlich, empfohlen, eingeschränkt oder verboten sind.
Woher stammt das PDF/A-Format?
Wie hat sich PDF/A entwickelt? Warum wurde eine PDF/A-Initiative gegründet? Wie wurden Dokumente in der Vergangenheit archiviert?
Welche Versionen und Konformitätsstufen hat PDF/A?
PDF/A ist als Mehrteiler-Standardreihe konzipiert: PDF/A-1, PDF/A-2, PDF/A-3 und PDF/A-4. Eine später herausgegebene Version ersetzt oder übertrumpft in keiner Weise eine zuvor herausgegebene. Zum Beispiel, PDF/A-1 konform
Dokumente, die bereits erstellt wurden, bleiben für die Langzeitarchivierung gültig. Sie können unverändert bleiben, sodass ein „Upgrade“ auf PDF/A-2 nicht erforderlich ist.
Die PDF/A-Versionen 1-3 sind zusätzlich in zwei bis drei Konformitätsstufen unterteilt, die angeben, ob ein Dokument neben der eindeutigen visuellen Reproduzierbarkeit (Basic = b) auch die Verwendung von Unicode-Text (Unicode = u) oder barrierefreien Zugang (Accessibility = a) ermöglicht. Mit PDF/A-4 werden je nach Inhalt oder vorgesehenem Gebrauch nur zwei Ebenen gebildet.
Empfehlung
Es sei denn, die Art der Dokumente legt einen anderen Standard nahe, empfiehlt PDF Tools die Archivierung im PDF/A-2 Standard. Die Konversion zu PDF/A-2 ist mit den richtigen Software-Tools einfach und von hoher Qualität. Zusätzlich vermeidet dieser Standard Risiken, die mit unbekannten Datei-Anhängen verbunden sind (siehe PDF/A-3).
Die Verwendung von PDF/A-1 für die heutigen Konversionsprozesse ist nicht ratsam, da der Mangel an Funktionalität dieses Standards, wie Transparenz, zu visuellen Änderungen im Dokument führen oder die Implementierung der Konversion verhindern kann. PDF/A-4 scheint ebenfalls wenig sinnvoll zu sein, da die überwiegende Mehrheit der vorhandenen Dokumente auf PDF 1.X basiert und die Konversion zu PDF/A-4 daher eine unnötig komplexe Konversion im Vergleich zu PDF/A-2 darstellen würde.
Wie werden Microsoft Office-Dokumente, E-Mails und Webseiten archiviert?
Im Vergleich zur Beibehaltung der Daten in ihrem ursprünglichen Format gibt es viele Vorteile, Dokumente aus digitalen Quellen im PDF/A-Format zu archivieren. Die Quellanwendungen werden schnell weiterentwickelt. Infolgedessen kann nach nur wenigen Jahren die Lesbarkeit und die authentische Anzeige von Daten nicht mehr garantiert werden. Darüber hinaus muss ein Unternehmen alle Anwendungen, die verwendet werden, und alle Plattformen, auf denen sie betrieben werden, warten.
Wie werden PDF/A-konforme Dokumente erstellt und verarbeitet?
Detaillierte Kenntnisse der PDF/A-Normen sind notwendig, um PDF/A-Dokumente zu erstellen und genau anzuzeigen. Dennoch reicht dieses Wissen allein nicht aus, um PDF/A-bezogene Prozesse optimal zu konfigurieren.
Was passiert während der Konvertierung in PDF/A?
Die Konvertierung eines Dokuments in ein PDF/A ist eine hybride Konvertierung. Das bedeutet, dass nicht nur die PDF/A-Spezifikation die Konvertierungsparameter beeinflusst, sondern auch die der PDF-Norm selbst. Typische Beispiele sind, dass die eingebetteten Schriftarten und die verwendeten Farben kalibriert werden müssen. Weniger bekannt ist, dass der PDF/A-Standard zusätzliche, strengere Regeln enthält.
PDF/A wurde mit dem Gedanken an die Erstellung von Dokumenten und nicht an die Konvertierung entwickelt. Dennoch muss ein PDF-zu-PDF/A-Konverter eine neue PDF-Datei erstellen, die den Regeln des Standards folgt. Hier sind einige Beispiele:
Nicht kalibrierte Farbräume können leicht durch kalibrierte ersetzt werden, indem für jeden der geräteabhängigen Farbräume DeviceGray, DeviceRGB und DeviceCMYK ein ICC-Farbprofil ausgewählt wird.
Es ist nicht notwendig, einen Ausgabeabsicht einzuführen, wenn er nicht in der Eingabedatei vorhanden ist. Wenn die Eingabedatei bereits ein Ausgabeabsicht-Profil hat, z. B. ein CMYK-Profil, wird empfohlen, es beizubehalten und die geräteabhängigen Farben, die sich darauf beziehen.
Fehlende Schriftarten-Programme einzubetten ist nur dann einfach, wenn die Originalschrift verfügbar ist, was oft nicht der Fall ist. Wenn die Schriftart nicht verfügbar ist, muss sie durch eine Ersatzschrift ersetzt werden, die der Originalschrift ähneln sollte.
Wenn Transparenz verboten ist, wie bei PDF/A-1, muss der Konverter eine Art Transparenzflattening durchführen oder die Datei ablehnen, wenn er dies nicht kann.
Bei verbotenen Funktionen wie JavaScript, multimedialen Inhalten, bestimmten Aktionen usw. hat der Konverter die Möglichkeit, die Funktionen zu entfernen oder abzulehnen.
Warum muss ein PDF/A-Dokument validiert werden?
Für Unternehmen ist es unerlässlich, dass sie wissen, dass die PDF- und PDF/A-Dokumente, die durch die geschäftsrelevanten Prozesse gehen, tatsächlich den jeweiligen Standards entsprechen. Nicht alles, was als PDF/A gekennzeichnet ist, ist tatsächlich PDF/A – PDF/A ist ein Qualitätskriterium, das das normgerechte Archivieren in einem langfristigen digitalen Archiv unterstützt. Doch wie kann sichergestellt werden, dass die extern und intern generierten PDF/A-Dokumente alle Kriterien des Standards erfüllen?
Ein PDF-Validator prüft die Konformität eines PDF-Dokuments mit einer bestimmten Spezifikation. Das Tool umfasst mehrere Regelsets – überwiegend in Form von Profilen – die verwendet werden, um die Dokumente entsprechend zu analysieren.
Zu welchem Zweck werden PDF/A-Dokumente unterschrieben?
In der heutigen Welt sind digitale Dokumente eng mit Geschäftsprozessen verbunden. Elektronische Signaturen spielen in dieser Hinsicht eine entscheidende Rolle. In diesem Bereich mangelt es jedoch an Wissen. Elektronische Signaturen haben vier Hauptfunktionen:
Ersetzen handschriftlicher Unterschriften: Elektronische Signaturen können die gleichen Anforderungen wie eine handschriftliche Unterschrift erfüllen, vorausgesetzt, sie entsprechen den geltenden rechtlichen Anforderungen.
Integrität schützen: Elektronische Signaturen sind ein „Siegel“ für digitale Dokumente, da sie nachfolgende Änderungen am Dokument offensichtlich machen.
Authentizität garantieren: Die elektronische Signatur kann verwendet werden, um sicherzustellen, dass die Unterschrift einer natürlichen oder juristischen Person eindeutig zugeordnet werden kann.
Autorisierung sicherstellen: Rechte und Befugnisse können im Zertifikat definiert und verwaltet und daher einer bestimmten Person zugeordnet werden. Eine elektronische Signatur kann sicherstellen, dass die Änderung immer identifizierbar und nachvollziehbar ist.
Wie elektronische Signaturen tatsächlich in Geschäftsprozesse integriert werden, hängt von der jeweiligen Situation ab. Im Falle von signierten Dokumenten wird das Format PDF/A zusammen mit einer digitalen Signiersoftware empfohlen, die alle Anforderungen für gültige Unterschriften und die langfristige Archivierung erfüllt.