PDF 2.0 – nächste Generation
Es ist selten, dass Industrieprodukte länger als 20 Jahre überdauern – insbesondere in der IT-Branche. Nicht einmal die Erfinder des PDF hätten sich vorstellen können, wie erfolgreich ihr Dateiformat sein würde, als sie die erste Version von Acrobat im Juni 1993 veröffentlichten. Die Mitglieder der Internationalen Organisation für Normung (ISO) arbeiten nun an der nächsten Generation dieses beliebten Formats.
Seit der Veröffentlichung von ISO-32000-1, mit dem Titel „Dokumentenmanagement – Portable Document Format – Teil 1: PDF 1.7“, Mitte 2008 hat sich die sechste Auflage des berühmten PDF-Referenzwerks von Adobe nicht wesentlich verändert – sie wurde lediglich in die ISO-Sprache übersetzt. Aber das wird sich ändern, wenn der zweite Teil des Standards, „Teil 2: PDF 2.0“, in Kürze veröffentlicht wird. Diese neue Version wurde von den ISO-Mitgliedern erstellt, genauer gesagt vom Technischen Ausschuss 171, Unterausschuss 2. Um klarzustellen, dass dies ein neuer Standard ist, wurde der Hauptversionsnummer eine „2“ hinzugefügt. Der Standard befindet sich derzeit im DIS (Draft International Standard)-Stadium, einem Schritt kurz vor der Veröffentlichung, und wird am 16. September 2015 zur Abstimmung gebracht.
Was wird der neue Standard bieten?
Die Liste der Änderungen enthält mehr als 50 Einträge. Die wichtigsten Änderungen und Verbesserungen betreffen die folgenden Bereiche:
Verschlüsselung: unverschlüsselter Wrapper verschlüsselter Dokumente, 256-Bit-AES-Verschlüsselung, Unicode-Passwörter
Digitale Signaturen: Signaturen basierend auf dem CAdES-Standard, Zertifikate basierend auf elliptischen Kurven, Langzeit-Signaturvalidierung (LTV)
Anmerkungen: Projektionen, 3D, reichhaltige Medien
Barrierefreiheit: Aussprachehilfen
3D: Unterstützung des neuen ISO-Standards „PRC“, 3D-Messungen
Dokumentteile
Der Ausschuss war auch mutig genug, einige veraltete Funktionen abzulehnen; die Hauptfunktionen sind:
XFA-Formulare: Adobes XML-basierte Formulartechnologie war für viele Anbieter eine ständige Quelle der Frustration
Film, Ton: multimediale Inhalte sind nicht mit dem Konzept eines portablen Dokumentenformats kompatibel
Überflüssige, redundante, veraltete oder nicht tragbare Informationen, wie das Dokumenten-Informationswörterbuch (ersetzt durch XMP), veraltete digitale Signaturen, betriebssystemabhängige Dateinamen und selten verwendete Standards, wie OPI (Open Prepress Interface)
Es gab auch einige wichtige Überarbeitungen des neuen Teils des Standards, insbesondere in den folgenden Kapiteln:
Rendering
Transparenz
Digitale Signaturen
Metadaten
Getaggte PDF und Barrierefreiheit
Aber die zahlreichen Änderungen haben ihren Tribut gefordert. Es hat sieben Jahre gedauert, um den zweiten Teil zu erstellen, viel länger als für vorherige Versionen benötigt wurde. Tatsächlich gelang es Adobe, in nur 15 Jahren sieben Versionen herauszubringen – und das in herausragender Qualität. Auf der positiven Seite hat der zweite Teil des Standards umfangreiche Beiträge von den ISO-Mitgliedern erhalten, und viele Teile des Textes sind klarer formuliert. Dies erleichtert der Branche das Verständnis der Spezifikation, erhöht die Implementierungsqualität und verbessert damit die Interoperabilität. Es wird gehofft, dass dies zu erheblich weniger „schlechten“ PDFs führt.
Welche Auswirkungen wird die neue Version haben?
Für die Hauptnutzungen von PDF – d.h. Archivierung (PDF/A), Dokumentenaustausch (PDF/X), Technik (PDF/E) und Barrierefreiheit (PDF/UA) – hat die ISO spezielle Unterstandards definiert, von denen die meisten auf dem ersten Teil des PDF-Standards basieren. Es ist wahrscheinlich, dass diese Standards ebenfalls angepasst werden, um sie relevant für den zweiten Teil zu machen. Es sollte jedoch nicht angenommen werden, dass der Hauptstandard jetzt „neu“ und die Unterstandards „alt“ sein werden.
Stattdessen sollte die Entwicklung dieser Standards als Interaktion betrachtet werden. Beispielsweise basieren viele Änderungen im zweiten Teil des PDF-Standards auf Erkenntnissen, die aus der Arbeit an den Unterstandards gewonnen wurden und in die Entwicklung integriert wurden. Darüber hinaus gibt es – im Gegensatz zum PDF-Masterstandard – keinen dringenden Handlungsbedarf, die Unterstandards PDF/X, PDF/E und PDF/UA zu ändern, da sie unabhängig von Adobe seit einiger Zeit optimiert wurden. Die Situation für PDF/A ist etwas anders.
Der Sonderfall der Archivierung
Sobald die ersten Version 2.0 PDF-Dateien erstellt werden, wird die Frage aufkommen, wie sie gemäß dem Standard archiviert werden können. PDF/A muss eine Antwort auf diese Frage haben. Anders als bei den anderen PDF-Unterstandards steht diese Anwendung unter einem gewissen Zeitdruck. Aber die schiere Anzahl der Änderungen erschwert es, eine schnelle Lösung zu finden. Die PDF/A-Community steht auch vor anderen Problemen, insbesondere im Zusammenhang mit der Validierung.
Der Validierungsprozess überprüft, ob eine PDF-Datei einem bestimmten Standard entspricht. Diese Überprüfung ist für PDF/X- und PDF/A-Dateien üblich und für Archivierungszwecke von entscheidender Bedeutung, da Verstöße gegen den Standard dazu führen können, dass archivierte Dateien nach 10 oder mehr Jahren nicht mehr perfekt lesbar sind.
Unterschiede in der Validierung von PDF/A-Dateien
Verschiedene kommerzielle Softwareprogramme (Validatoren) können zur Überprüfung der Konformität mit verschiedenen Teilen des PDF/A-Standards verwendet werden. Da alle Teile des PDF/A-Standards auf bestimmten Master-Standards basieren, wie PDF 1.4 und PDF 1.7, müssen die Validatoren auch die Konformität mit diesen Standards überprüfen. Darüber hinaus interpretieren die Hersteller dieser Validatoren oft den Text der Standards unterschiedlich. Beide Faktoren können dazu führen, dass verschiedene Validatoren unterschiedliche Testergebnisse produzieren.
Darüber hinaus können einzelne Benutzer unrealistische Erwartungen an das, was ein Validator leisten kann und sollte, haben. Die Mängel der Validatoren und die unrealistischen Erwartungen einzelner Benutzer können beide dazu führen, dass das Konzept PDF/A in Frage gestellt wird. Die Forderungen nach einem „definitiven Validator“ werden daher immer lauter.
Das VeraPDF-Projekt
VeraPDF ist ein Projekt der Open Preservation Foundation. Es wurde als Konsortium zwischen den Partnern PDF Association, Dual Lab, The Digital Preservation Coalition und Keep Solutions gegründet. Das Ziel des Projekts ist die Entwicklung eines PDF/A-Validators. Die Entwicklungsarbeiten wurden von PREFORMA ('PREservation FORMAts for Culture Information/E-Archives'), einem vor-kommerziellen Beschaffungsprojekt (PCP), das von dem EU-Programm FP7-ICT mitgegründet wurde, ausgeschrieben. Der Open-Source-Validator von PREFORMA wird für drei Dateiformate – PDF, zusätzlich TIFF und ein Videoformat – verwendet und unterstützt die langfristige Archivierung in Gedächtnisinstitutionen. VeraPDF erhielt den Auftrag für die ersten beiden Implementierungsphasen des PDF/A-Validators. Die erste Phase, die sich hauptsächlich mit der Festlegung der Spezifikationen des Validators beschäftigte, ist jetzt abgeschlossen. Die zweite Phase, die Realisierung eines Prototyps, steht kurz vor dem Abschluss.
Bisher hat das Projekt gezeigt, dass es nicht so einfach ist, einen PDF/A-Validator von Grund auf neu zu entwickeln; es erfordert viel Erfahrung mit PDF. Aus politischen Gründen war es nicht möglich, die Aufgabe einem der kommerziellen Validatorhersteller zu übertragen. Die Einbeziehung der PDF-Assoziation bietet den Vorteil, auf die Erfahrungen des Herstellers zurückgreifen zu können und sicherzustellen, dass die Entwicklung des Validators von einer Vielzahl von Quellen unterstützt wird.
Der Nachteil ist jedoch, dass die Arbeit viel komplexer und zeitaufwändiger wird. Darüber hinaus stehen keine Mittel zur Verfügung, um das Projekt vollständig umzusetzen, sodass die Hersteller versuchen, das Konzept durch Softwarearchitektur (Plug-ins) nutzbar zu machen.
Ein Vorteil, den das Projekt gegenüber kommerziellen Validatoren haben wird, ist, dass der Validator selbst „validiert“ werden kann. Theoretisch wird dies möglich sein, indem der gesamte Programmcode öffentlich gemacht wird. In der Realität schaut jedoch fast niemand wirklich auf den Code. Deshalb versuchen die Hersteller, sich auf geeignete Testdateien zu konzentrieren. Es ist jedoch nicht überraschend, dass die Entwicklung der Testdateien ebenso lange dauert wie die Entwicklung des Validators selbst. Die vorhandenen Test-Suites – wie Isartor, entwickelt von der PDF Association – sind bei weitem nicht ausreichend.
Zusammenfassung
Obwohl die neue PDF-Version kurz vor der Veröffentlichung steht, hat das VeraPDF-Projekt noch keine konkreten Ergebnisse für die Validierung von PDF/A-Dokumenten geliefert. Die Erfahrungen mit diesem Projekt beginnen, die Gemeinschaft zu spalten und Enttäuschung breitet sich aus. Viele Erwartungen werden nicht erfüllt, oder nicht bis sehr spät. Daher müssen die Benutzer wahrscheinlich weiterhin auf kommerzielle Validatoren setzen, was voraussichtlich auch in naher Zukunft der Fall sein wird.