PDF 2.0 – nächste Generation

Es ist selten, dass Industrieprodukte mehr als 20 Jahre überleben - vor allem in der IT-Branche. Als die Erfinder des PDF-Formats im Juni 1993 die erste Version von Acrobat auf den Markt brachten, konnten sie nicht ahnen, wie erfolgreich ihr Dateiformat werden würde. Die Mitglieder der Internationalen Organisation für Normung (ISO) arbeiten derzeit an der nächsten Generation dieses beliebten Formats.

Seit der Veröffentlichung der ISO-32000-1 mit dem Titel "Document Management - Portable Document Format- Part 1: PDF 1.7" Mitte 2008 veröffentlicht wurde, hat sich die sechste Ausgabe der berühmten PDF-Referenz von Adobe nicht wesentlich verändert - sie wurde lediglich in die ISO-Sprache übersetzt. Dies wird sich jedoch ändern, wenn der zweite Teil der Norm, "Teil 2: PDF 2.0", in Kürze veröffentlicht wird. Diese neue Version wurde von den ISO-Mitgliedern erstellt, genauer gesagt vom Technischen Komitee 171, Unterkomitee 2. Um zu verdeutlichen, dass es sich um eine neue Norm handelt, wurde der Hauptversionsnummer eine "2" angefügt. Die Norm befindet sich derzeit im DIS-Stadium (Draft International Standard), einem Schritt kurz vor der Veröffentlichung, und wird am 16. September 2015 zur Abstimmung gestellt.

Was wird die neue Norm bieten?

Die Liste der Änderungen enthält mehr als 50 Einträge. Die wichtigsten Änderungen und Verbesserungen betreffen die folgenden Bereiche:

  • Verschlüsselung: unverschlüsselter Wrapper für verschlüsselte Dokumente, 256-Bit-AES-Verschlüsselung, Unicode-Passwörter

  • Digitale Signaturen: Signaturen auf der Grundlage des CAdES-Standards, Zertifikate auf der Grundlage elliptischer Kurven, langfristige Signaturvalidierung (LTV)

  • Annotationen: Projektionen, 3D, Rich Media

  • Zugänglichkeit: Aussprachehinweise

  • 3D: Unterstützung für den neuen ISO-Standard "PRC", 3D-Messungen

  • Teile des Dokuments

Der Ausschuss war auch mutig genug, einige überholte Funktionen zu streichen; die wichtigsten davon sind:

  • XFA-Formulare: Die XML-basierte Formulartechnologie von Adobe war für viele Anbieter eine ständige Quelle der Frustration

  • Film, Ton: Multimediale Inhalte sind nicht mit dem Konzept eines portablen Dokumentenformats vereinbar.

  • Überflüssige, redundante, veraltete oder nicht portierbare Informationen, wie das Dokumentinformationsverzeichnis (ersetzt durch XMP), veraltete digitale Signaturen, betriebssystemabhängige Dateinamen und selten verwendete Standards wie OPI (Open Prepress Interface)

Auch im neuen Teil der Norm wurden einige wichtige Änderungen vorgenommen, insbesondere in den folgenden Kapiteln:

  • Rendering

  • Transparenz

  • Digitale Signaturen

  • Metadaten

  • Tagged PDF und Barrierefreiheit Unterstützung

Doch die zahlreichen Veränderungen haben ihren Tribut gefordert. Die Erstellung des zweiten Teils hat sieben Jahre gedauert, viel länger als für frühere Versionen nötig war. Tatsächlich hat es Adobe geschafft, in nur 15 Jahren sieben Versionen herauszubringen - und das in hervorragender Qualität. Positiv zu vermerken ist, dass der zweite Teil der Norm von den ISO-Mitgliedern ausführlich kommentiert wurde und viele Teile des Textes klarer formuliert sind. Dies erleichtert der Industrie das Verständnis der Spezifikation, erhöht die Qualität der Implementierung und verbessert so die Interoperabilität. Man hofft, dass dies zu weit weniger "schlechten" PDFs führen wird.

Welche Auswirkungen wird die neue Version haben?

Für die wichtigsten Verwendungszwecke von PDF - d.h. Archivierung (PDF/A), Dokumentenaustausch (PDF/X), Technik (PDF/E) und Barrierefreiheit (PDF/UA) - hat die ISO spezielle Unterstandards definiert, von denen die meisten auf dem ersten Teil des PDF-Standards basieren. Es ist wahrscheinlich, dass diese Normen auch angepasst werden, um sie für den zweiten Teil relevant zu machen. Es sollte jedoch nicht davon ausgegangen werden, dass die Hauptnorm nun "neu" und die Teilnormen "alt" sind.

Stattdessen sollte die Entwicklung dieser Normen als eine Interaktion betrachtet werden. So beruhen viele Änderungen im zweiten Teil der PDF-Norm auf Erkenntnissen, die aus der Arbeit an den Teilnormen gewonnen und in die Entwicklung eingearbeitet wurden. Darüber hinaus besteht - im Gegensatz zum PDF-Master-Standard - keine wirkliche Dringlichkeit, die Sub-Standards PDF/X, PDF/E und PDF/UA zu ändern, da sie bereits seit einiger Zeit unabhängig von Adobe optimiert wurden. Bei PDF/A ist die Situation etwas anders.

Der Sonderfall der Archivierung

Sobald die ersten PDF-Dateien der Version 2.0 erstellt werden, stellt sich die Frage, wie sie standardkonform archiviert werden können. PDF/A muss eine Antwort auf diese Frage haben. Im Gegensatz zu den anderen PDF-Substandards steht diese Anwendung unter einem gewissen Zeitdruck. Doch die schiere Anzahl der Änderungen macht es schwierig, eine schnelle Lösung zu finden. Die PDF/A-Gemeinschaft steht auch vor anderen Problemen, insbesondere im Zusammenhang mit der Validierung.

Der Validierungsprozess prüft, ob eine PDF-Datei einem bestimmten Standard entspricht. Diese Prüfung ist bei PDF/X- und PDF/A-Dateien üblich und für Archivierungszwecke unerlässlich, da Verstöße gegen die Norm dazu führen können, dass archivierte Dateien nach 10 oder mehr Jahren nicht mehr einwandfrei lesbar sind.

Unterschiede bei der Validierung von PDF/A-Dateien

Verschiedene kommerzielle Softwareprogramme (Validatoren) können zur Überprüfung der Konformität mit verschiedenen Teilen des PDF/A-Standards verwendet werden. Da alle Teile des PDF/A-Standards auf spezifischen Master-Standards wie PDF 1.4 und PDF 1.7 basieren, müssen die Validatoren auch die Konformität mit diesen Standards prüfen. Hinzu kommt, dass die Hersteller dieser Validierer den Text der Normen oft unterschiedlich auslegen. Diese beiden Faktoren können dazu führen, dass verschiedene Validierer unterschiedliche Testergebnisse liefern.

Darüber hinaus haben einzelne Benutzer möglicherweise unrealistische Erwartungen an das, was ein Validierer leisten kann und sollte. Sowohl die Unzulänglichkeiten der Validierer als auch die unrealistischen Erwartungen einzelner Anwender können dazu führen, dass das PDF/A-Konzept in Frage gestellt wird. Der Ruf nach einem "endgültigen Validierer" wird daher immer lauter.

Das VeraPDF-Projekt

VeraPDF ist ein Projekt der Open Preservation Foundation. Es wurde als Konsortium zwischen den Partnern PDF Association, Dual Lab, The Digital Preservation Coalition und Keep Solutions gegründet. Das Ziel des Projekts ist die Entwicklung eines PDF/A-Validators. Die Entwicklungsarbeit wurde von PREFORMA ("PREservation FORMAts for Culture Information/E-Archives") ausgeschrieben, einem vorkommerziellen Beschaffungsprojekt (PCP), das vom FP7-ICT-Programm der EU mitfinanziert wurde. Der Open-Source-Validator von PREFORMA wird für drei Dateiformate eingesetzt - PDF sowie TIFF und ein Videoformat - und unterstützt die Langzeitarchivierung in Speichereinrichtungen. VeraPDF hat den Auftrag für die ersten beiden Implementierungsphasen des PDF/A-Validators erhalten. Die erste Phase, in der es hauptsächlich um die Festlegung der Spezifikationen des Validierers ging, ist nun abgeschlossen. Die zweite Phase, die Realisierung eines Prototyps, steht kurz vor dem Abschluss.

Bisher hat das Projekt gezeigt, dass es nicht so einfach ist, einen PDF/A-Validator von Grund auf zu entwickeln; es erfordert viel Erfahrung im Bereich PDF. Aus politischen Gründen war es nicht möglich, einen der kommerziellen Validatorhersteller mit dieser Aufgabe zu betrauen. Die Einbindung der PDF Association bietet den Vorteil, dass sie auf die Erfahrung des Herstellers zurückgreifen kann und die Entwicklung des Validators von vielen Seiten unterstützt wird.

Der Nachteil ist jedoch, dass die Arbeit sehr viel komplexer und langwieriger wird. Außerdem stehen für die vollständige Umsetzung des Projekts keine Mittel zur Verfügung, so dass die Hersteller versuchen, das Konzept mit Hilfe einer Softwarearchitektur (Plug-ins) nutzbar zu machen.

Ein Vorteil des Projekts gegenüber kommerziellen Validierern besteht darin, dass der Validierer selbst "validiert" werden kann. In der Theorie wird dies dadurch ermöglicht, dass der gesamte Programmcode öffentlich gemacht wird. In Wirklichkeit schaut sich fast niemand den Code wirklich an. Deshalb versuchen die Hersteller, sich auf geeignete Testdateien zu konzentrieren. Es ist jedoch nicht verwunderlich, dass die Entwicklung der Testdateien genauso lange dauert wie die Entwicklung des Validators selbst. Die bestehenden Testsuiten - wie das von der PDF Association entwickelte Isartor - reichen bei weitem nicht aus.

Zusammenfassung

Obwohl die neue PDF-Version kurz vor der Freigabe steht, hat das VeraPDF-Projekt noch keine konkreten Ergebnisse für die Validierung von PDF/A-Dokumenten geliefert. Die Erfahrungen mit diesem Projekt beginnen die Gemeinschaft zu spalten, und die Enttäuschung macht sich breit. Viele Erwartungen werden nicht oder erst sehr spät erfüllt. Daher werden sich die Nutzer wohl auch in absehbarer Zukunft auf kommerzielle Validierer verlassen müssen.

Gefällt Ihnen, was Sie sehen? Teilen Sie es mit einem Freund.

Grüezi! Wie können wir helfen?

Phone