Die Disziplin der Konvertierung von PDF zu PDF/A
Wir wissen alle, dass die Konvertierung eines Dateiformats in ein anderes nicht so einfach ist, wie man es sich wünscht, und unangenehme Überraschungen mit sich bringen kann. Es ist jedoch kaum bekannt, dass dies für die Konvertierung von PDF zu PDF/A der Fall ist. Warum ist das so?
PDF/A ist eine Untermenge von PDF. Dies ist die offensichtliche Tatsache. Typische Beispiele sind, dass die eingebetteten Schriftarten und die verwendeten Farben kalibriert werden müssen. Weniger bekannt ist, dass der PDF/A-Standard zusätzliche, strengere Regeln enthält. Ein Beispiel hierfür ist, dass die Textzeichen nicht auf das Glyphenzeichen .notdef verweisen dürfen.
Wie auch immer. PDF/A wurde mit Blick auf die Dokumentenerstellung und nicht auf die Konvertierung entwickelt. Dennoch muss ein PDF-zu-PDF/A-Konverter eine neue PDF-Datei generieren, die den Regeln des Standards folgt. Einerseits ist dies oft nicht einfach. Andererseits gibt es viele Möglichkeiten für die Zuordnung und unterschiedliche Strategien. Hier sind einige Beispiele.
Nicht kalibrierte Farbräume können einfach durch kalibrierte ersetzt werden, indem ein ICC-Farbprofil für jeden der geräteabhängigen Farbräume DeviceGray, DeviceRGB und DeviceCMYK ausgewählt wird.
Es ist nicht notwendig, ein Ausgabeziel einzuführen, wenn es im Eingabedokument nicht vorhanden ist. Wenn das Eingabedokument bereits ein Ausgabeziel-Profil hat, z.B. ein CMYK-Profil, ist es ratsam, es beizubehalten und die geräteabhängigen Farben, die sich darauf beziehen.
Das Einbetten fehlender Schriftprogramme ist nur einfach, wenn die ursprüngliche Schriftart verfügbar ist, was oft nicht der Fall ist. Wenn das Schriftprogramm nicht verfügbar ist, muss es durch ein Schriftprogramm ersetzt werden, das dem Erscheinungsbild so nahe wie möglich kommt. Die Anzeigeanwendungen haben eine eingebaute Schriftartenersatzstrategie. Ein Konverter sollte diese Strategien ebenfalls befolgen, da die resultierende Datei unabhängig davon, ob die Schriftarten eingebettet sind oder nicht, gleich aussehen sollte.
Wenn Transparenz verboten ist, wie bei PDF/A-1, muss der Konverter eine Art von Transparenzabbildung durchführen oder die Datei ablehnen, wenn dies nicht möglich ist.
Bei verbotenen Funktionen wie JavaScript, Multimedia-Inhalten, irgendeiner Art von Aktionen usw. hat der Konverter die Möglichkeit, die Funktionen zu entfernen oder abzulehnen, wenn der Benutzer dies nicht möchte.
Textzeichen, die auf das Glyphenzeichen .notdef abgebildet sind, können auf ein neues Glyphenzeichen umgeordnet werden, das eine Kopie des Glyphenzeichens .notdef ist.
Die obige Liste kann nur einen Eindruck vermitteln. Es gibt sicherlich viel mehr Fälle, als hier gezeigt. Es gibt jedoch weitere Aufgaben, die ein Konverter ausführen muss. Hier sind einige davon:
Vorvalidierung: Wenn das Eingabedokument bereits dem angeforderten Standard entspricht, ist es nicht nötig, die Konvertierung durchzuführen. Das ist insbesondere bei digital signierten Dokumenten nützlich.
Nachvalidierung: Nach der Konvertierung möchte der Benutzer überprüfen, ob das konvertierte Ergebnis dem angeforderten Standard entspricht.
Reparatur: Der Benutzer erwartet, dass der Konverter die Eingabedatei repariert, wenn sie geringfügige Beschädigungen wie fehlende erforderliche Wörterbucheinträge, beschädigte Verweistabellen usw. enthält.
Rückgabestatus: Ein feingliedriger Rückgabestatuswert ermöglicht einen gut strukturierten, benutzerkontrollierten Konvertierungsprozess.
Protokolldatei: Ein unvermeidliches Mittel zur Auffindung und Beseitigung von Konvertierungsproblemen.