Was ist PDF-Kompression und -Optimierung?
Die meisten Menschen sind sich einig, dass PDF-Kompression und -Optimierung etwas mit der Reduzierung der Dateigröße zu tun haben. Manchmal geht es um schnellere Darstellung. Wie auch immer, Kompression und Optimierung sind ein breites Thema und es ist sicherlich einen näheren Blick wert.
Kompression und Optimierung sind seit Beginn ein wichtiges Thema. Die ersten drei Auflagen des berühmten PDF-Referenzhandbuchs widmen diesem Thema nicht weniger als vier Kapitel. Übrigens finden Sie in ihnen sehr nützliche Tipps, die ich allen Herstellern von PDF-Software wärmstens empfehlen kann. Aber es gibt neben der optimalen Dateierstellung auch andere Dokumentenverarbeitungsfunktionen, wie Zusammenführen, Druckvorbereitung usw., bei denen die Optimierung ins Spiel kommt.
Anstatt zu sehr ins Detail zu gehen, lassen Sie mich die wichtigsten Optimierungsbereiche auflisten:
Nicht verwendete Objekte, die durch neuere Versionen ersetzt wurden oder überhaupt nicht verwendet werden oder einen Standardwert beschreiben usw. können sicher entfernt werden.
Redundante Objekte, die eine identische Struktur aufweisen, können zu einer Instanz zusammengeführt werden. Dies funktioniert jedoch nur für bestimmte Objekttypen wie Ressourcen, Inhaltsströme usw. Aber dies gilt nicht für Objekte, deren Instanz ein implizites Attribut wie Seitenobjekte, Baum-Elemente usw. darstellt.
Unerwünschte Objekte, die für den vorgesehenen Zweck der Datei nicht benötigt werden, können verworfen werden. Ein Beispiel: Eine zu druckende Datei benötigt keine Artikelstränge, Informationen zur Web-Erfassung usw.
Bilder können verkleinert werden, indem man ihre Auflösung auf die Zielgeräteauflösung reduziert oder stärkere Kompressionsalgorithmen verwendet. Insbesondere bei gescannten Bildern können Techniken wie Mixed Raster Content (MRC) die Dateigröße erheblich reduzieren. Ich werde später einen separaten Artikel darüber veröffentlichen.
Eingebettete Schriftarten können optimiert werden, indem Glyphenuntergruppen erstellt werden oder verschiedene Instanzen des gleichen Schriftprogramms in eine zusammengeführt werden. Einige Druck-Workflows erfordern, dass das eingebettete Schriftprogramm entfernt und durch die installierte Schriftart ersetzt wird.
Transparenz stellt oft eine Herausforderung für Druckgeräte dar und ist ein Muss, bevor das Dokument in eine Druckersprache wie PostScript oder PCL konvertiert wird. Das Aplanen von Transparenz, das heißt, der Prozess, transparente Objekte durch opake zu ersetzen, umfasst in den meisten Fällen die Rasterung in der Geräteauflösung. Das Aplanen erhöht in den meisten Fällen die Dateigröße.
Kompression ist ein allgemeines Mittel zur Reduzierung der Größe von Streams. Seit Version <b>1,5</b> können Objekte und Querverweisinformationen in komprimierten Streams platziert werden, um Speicherplatz zu sparen. Geeignet sind objektslose Streams, die nicht für das Rendering verwendet werden, wie Konturen, Dokumentstruktur usw.
Linearisation fügt Informationen für eine schnelle Webansicht hinzu und reduziert somit nicht die Dateigröße. Ich werde später einen Artikel zu diesem Thema veröffentlichen.
Neben den oben genannten bieten einige Tools auch komplexere, aber riskante Funktionen wie:
Farbkonvertierung von Texten, Pfaden und Bildern ist nicht so einfach, wie es scheint. Insbesondere wenn Transparenz oder Überdrucken beteiligt ist, kann die Farbkonvertierung zum Albtraum werden.
Unsichtbare Objekte die vollständig von anderen opaken Objekten verdeckt oder abgeschnitten werden, können entfernt werden, was nicht wünschenswert ist, wenn das Dokument später bearbeitet werden muss.
Operatoren-Koaleszenz wird verwendet, um die Anzahl der verwendeten Operatoren zu reduzieren und das Rendering zu beschleunigen.