Die Disziplin der Konvertierung von PDF in PDF/A
Wir wissen alle, dass die Konvertierung eines Dateiformats in ein anderes nicht so einfach ist, wie man es sich wünschen würde, und zu unangenehmen Überraschungen führen kann. Es ist jedoch kaum bekannt, dass dies für die Konvertierung von PDF in PDF/A der Fall ist. Warum ist das so?
PDF/A ist eine Teilmenge von PDF. Dies ist eine offensichtliche Tatsache. Typische Beispiele sind, dass die eingebetteten Schriftarten und die verwendeten Farben kalibriert werden müssen. Weniger bekannt ist, dass der PDF/A-Standard zusätzliche, strengere Regeln enthält. Ein Beispiel dafür ist, dass die Textzeichen nicht auf das .notdef-Glyph verweisen dürfen.
Wie auch immer. PDF/A wurde mit der Erstellung von Dokumenten im Sinn und nicht mit der Konvertierung entworfen. Dennoch muss ein PDF-zu-PDF/A-Konverter eine neue PDF-Datei erstellen, die den Regeln des Standards folgt. Einerseits ist das oft nicht einfach. Andererseits gibt es viele Möglichkeiten für die Zuordnung und verschiedene Strategien. Hier sind einige Beispiele.
Nicht kalibrierte Farbräume können leicht durch kalibrierte ersetzt werden, indem man ein ICC-Farbprofil für jeden der geräteabhängigen Farbräume DeviceGray, DeviceRGB und DeviceCMYK wählt.
Es ist nicht notwendig, eine Ausgabeabsicht einzuführen, wenn sie nicht in der Eingabedatei vorhanden ist. Wenn die Eingabedatei bereits ein Ausgabeabsichtprofil hat, z. B. ein CMYK-Profil, wird empfohlen, es beizubehalten, sowie die geräteabhängigen Farben, die sich darauf beziehen.
Das Einbetten fehlender Schriftartprogramme ist nur einfach, wenn die ursprüngliche Schriftart verfügbar ist, was oft nicht der Fall ist. Wenn das Schriftartprogramm nicht verfügbar ist, muss es durch ein Schriftartprogramm ersetzt werden, das das nächstmögliche Erscheinungsbild hat. Die Anzeigeanwendungen haben eine integrierte Schriftartenersatzstrategie. Ein Konverter sollte ebenfalls diesen Strategien folgen, da die resultierende Datei unabhängig von der Einbettung oder Nicht-Einbettung der Schriftarten gleich aussehen sollte.
Wenn Transparenz verboten ist, wie bei PDF/A-1, muss der Konverter eine Art von Transparenzflachlegung durchführen oder die Datei ablehnen, wenn er es nicht kann.
Mit verbotenen Funktionen wie JavaScript, multimedialen Inhalten, bestimmten Aktionen usw. hat der Konverter die Möglichkeit, die Funktionen zu entfernen oder die Datei abzulehnen, wenn der Benutzer dies nicht möchte.
Textzeichen, die auf das .notdef-Glyph abzubilden sind, können auf ein neues Glyph umgemappt werden, das eine Kopie des .notdef-Glyphs ist.
Die obige Liste kann nur einen Eindruck vermitteln. Es gibt sicherlich viel mehr Fälle als hier gezeigt. Es gibt jedoch weitere Aufgaben, die ein Konverter ausführen muss. Hier sind einige davon:
Vorvalidierung: Wenn das Eingabedokument bereits den geforderten Standard erfüllt, ist keine Konvertierung erforderlich. Das ist insbesondere mit digital signierten Dokumenten nützlich.
Nachvalidierung: Nach der Konvertierung möchte der Benutzer überprüfen, ob das konvertierte Ergebnis dem geforderten Standard entspricht.
Reparatur: Der Benutzer erwartet, dass der Konverter die Eingabedatei repariert, wenn sie kleinere Schäden wie fehlende obligatorische Wörterbucheinträge, beschädigte Querverweistabellen usw. enthält.
Rückgabestatus: Ein fein abgestufter Rückgabestatuswert ermöglicht einen gut gestalteten, benutzerkontrollierten Konvertierungsprozess.
Protokolldatei: Ein unvermeidliches Mittel zur Lokalisierung und Beseitigung von Konvertierungsproblemen.