Aufteilen und Zusammenführen von Seiten in PDF-Dokumenten
Das Heraussuchen von Seiten aus einer Reihe von Eingabedokumenten und deren Neuanordnung in einem Satz von Ausgabedokumenten gehört zur täglichen Routine in einer Dokumentenmontageanwendung. Auf den ersten Blick scheint dies eine klare und verständliche Aufgabe zu sein. Aber PDF bietet einige Besonderheiten, auf die Sie bei der Montage achten sollten.
Ein Tool zum Teilen und Zusammenführen von Seiten muss im Wesentlichen zwei Arten von Datenstrukturen verarbeiten können:
Alle Objekte, die zu einer bestimmten Seite gehören
Objekte, die zum Dokument gehören und sich auf eine bestimmte Seite beziehen
Beginnen wir mit der ersten Art. Ein Seitenobjekt aus dem Seitenbaum eines Eingabedokuments abzurufen und in den Seitenbaum des Ausgabedokuments einzufügen, ist naheliegend und recht einfach zu implementieren. Alle Objekte, die von diesem Seitenobjekt referenziert werden, werden ebenfalls kopiert. Dies funktioniert auch dann recht gut, wenn es sich bei den referenzierten Objekten um gemeinsam genutzte Objekte wie Seitenressourcen (Schriftarten, Farbräume usw.) und Inhaltsstromobjekte handelt. Wenn das Werkzeug sicherstellen muss, dass gemeinsam genutzte Objekte auch im Ausgabedokument gemeinsam genutzt werden, was sicherlich keine große Kunst ist. So weit, so gut.
Etwas komplizierter wird es jedoch bei allen Objekten, die nicht direkt von der jeweiligen Seite referenziert werden, aber in irgendeiner Weise mit ihr in Verbindung stehen. Diese Objekte gehören zum Dokument selbst und sind für alle Seiten gleich. Beispiele für solche Objekte sind Umrissbäume, benannte Zielbäume, Formulare und vieles mehr. In den meisten Fällen ist es nicht sinnvoll, alle diese Objekte in das Ausgabedokument zu kopieren. Das Werkzeug muss diese Datenstrukturen auf eine sinnvolle Teilmenge reduzieren. So werden beispielsweise nur die Umrisse kopiert, die sich auf die Seitenmenge im Ausgabedokument beziehen. Es ist nicht immer einfach herauszufinden, welche Objekte sich auf diesen Seitensatz beziehen, und es kann erforderlich sein, dass das Tool konfigurierbaren Richtlinien folgt.
Das Zusammenführen von Seiten aus verschiedenen Dokumentquellen ist viel schwieriger als das Aufteilen. Auch hier ist das Kopieren von Seiten und deren referenzierten Objekten einfach. Die Zusammenführung von Objekten aus Datenstrukturen auf Dokumentenebene wie Gliederungsbäumen, benannten Zielbäumen usw. ist im Allgemeinen nicht einfach. Der Grund dafür ist, dass die Namen von Baumelementen aus verschiedenen Quellen möglicherweise nicht eindeutig sind und das Tool diese Kollisionen auflösen muss. Dazu muss das Tool wiederum konfigurierbaren Richtlinien folgen.
Ein gut durchdachtes Split- und Merge-Tool ist jedoch in der Lage, die oben beschriebenen besonderen Situationen zu bewältigen. Neben der Hauptfunktion bieten die meisten Werkzeuge zusätzliche Funktionen, die im Zusammenhang mit der Zusammenstellung von Dokumenten verwendet werden. Einige davon sind:
Entschlüsselung von Eingabedokumenten und Verschlüsselung von Ausgabedokumenten
Ausgabedokument linearisieren
Seiten rotieren
Vergrößern und Verkleinern von Seitengrößen