Bilder in eine PDF-Datei importieren - eine scheinbar triviale Aufgabe
Ein Bild sagt mehr als tausend Worte. Deshalb sind sie liebevoll in PDF-Dateien eingebettet. Man würde erwarten, dass das Einbetten von Bildern in eine PDF-Datei eine einfache Aufgabe ist. Weil es so einfach scheint, gibt es auch viele, darunter kostenlose, Werkzeuge dafür. Aber tun diese Werkzeuge, was Sie von ihnen erwarten? Ein genauerer Blick zeigt, dass das Einbetten von Bildern alles andere als trivial ist.
Lass uns beginnen, indem wir Bilddaten im beliebten JPEG-Format einbetten. Viele PDF-Erstellungsprogramme nehmen einfach den JPEG-Datenstrom und betten ihn unverändert in die PDF-Datei ein. Funktioniert das einfach? Die Antwort lautet: in den meisten Fällen, aber nicht immer. Der PDF-Standard verlangt, dass nur sogenannte Baseline-JPEGs eingebettet werden dürfen. Aber es gibt auch sogenannte Multi-Scan-, progressive und arithmetisch kodierte JPEGs. Diese sind nicht erlaubt und können dann von vielen PDF-Viewern nicht angezeigt werden. Die Tatsache, dass Acrobat solche PDF-Dateien ohne Fehlermeldung anzeigt, verhindert nicht wirklich deren Verbreitung. Das ist besonders problematisch, wenn die Datei angeblich den PDF/A-Standard erfüllt, da viele PDF-Validierungstools die Bildströme nicht auf die Konformität mit dem Standard untersuchen.
Es wird ähnlich problematisch, wenn die G3-Faxbilddatenströme von einem TIFF-Container in eine PDF-Datei übertragen werden. Die Spezifikationen von TIFF und PDF sind aus welchen Gründen auch immer leicht unterschiedlich, sodass dieses Projekt ziemlich schief gehen kann.
Beim Einbetten von Bilddaten muss das Format der Bildquelle sorgfältig analysiert und der Datenstrom konvertiert oder sogar neu komprimiert werden, um den PDF-Spezifikationen zu entsprechen.
Aber es gibt auch andere Gründe, den Bildstrom zu bearbeiten. JPEG-Strom enthalten auch oft viele Segmente, die im PDF nicht benötigt werden oder die an einem anderen Ort gespeichert werden müssen. Zum Beispiel sollten Exif-Daten (Kameraeinstellungen, GPS-Standort usw.) extrahiert, in das XMP-Metadatenformat konvertiert und dem Bildobjekt als separate Eigenschaft zugewiesen werden. Weitere Segmente, wie private Photoshop-Daten, können ebenfalls entfernt werden, da sie keine Verwendung haben und nur viel Platz einnehmen.
Abgesehen vom Bildstrom gibt es auch andere Informationen in den Quelldateien, die in die PDF-Datei übertragen werden sollten, aber oft vergessen werden. Typischerweise handelt es sich um Farbprofile und Metadaten. Aber so einfach ist es nicht. Da TIFF-Dateien und andere Bildformate nicht direkt in die PDF-Datei eingebettet werden können, müssen die Container entpackt und so konvertiert werden, dass sie in die PDF-Datei übertragen werden können. Zum Beispiel werden die Informationen im TIFF-Dateiformat in sogenannten Tags gespeichert, die neben den Bilddaten Metadaten enthalten. Diese Metadaten müssen zuerst in das XMP-Format konvertiert werden, bevor sie in die PDF-Datei eingebettet werden können. Ähnlich verhält es sich mit den Farben. Oft werden die Beschreibungen der Farbprofile nicht einfach als Farbprofile gespeichert und müssen in eine PDF-Farbraumbeschreibung umgewandelt werden.
Es gibt also viele kleine Details zu beachten, die von vielen Werkzeugen nicht richtig oder gar nicht behandelt werden. Es lohnt sich daher, ein professionelles Werkzeug für eine scheinbar triviale Aufgabe zu verwenden.
Ein Bild sagt mehr als tausend Worte. Es ist jedoch sicherlich notwendig, mehr als tausend Worte darüber zu schreiben, wie Bilder korrekt in eine PDF-Datei eingebettet werden sollten.