Diviser et fusionner les pages des documents PDF
Une page unique d'un certain nombre de documents d'entrée et de les réorganiser dans un ensemble de documents de sortie appartient à la routine quotidienne dans une demande d'assemblage de documents. À première vue, cela semble être une tâche claire et compréhensible. Mais PDF offre des fonctionnalités spéciales, sur lesquelles vous devriez garder un œil pendant l'assemblage.
Essentiellement, un outil de séparation et de fusion de pages doit être en mesure de gérer deux types de structures de données :
Tous les objets qui appartiennent à une page spécifique
Objets qui appartiennent au document et sont liés à la page spécifique
Commençons par le premier type. Pour récupérer un objet de page dans l'arborescence des pages d'un document en entrée et l'insérer dans l'arborescence des pages du document de sortie est évident et assez facile à implémenter. Tous les objets référencés par cet objet de page sont également copiés. Cela fonctionne assez bien, même si les objets référencés sont des objets partagés tels que les ressources de page (polices, espaces de couleur, etc.) et les objets de flux de contenu. Si l'outil a besoin de s'assurer que les objets partagés restent partagés dans le document de sortie, ce qui n'est certainement pas une science fusée. Jusqu'ici, tout va bien.
Les choses deviennent un peu plus compliquées, cependant, pour tous les objets qui ne sont pas directement référencés par la page spécifique, mais qui y sont liés. Ces objets appartiennent au document lui-même et sont communs à toutes les pages. Les exemples de ces objets sont les arbres, les arbres de destination nommés, les formes et beaucoup plus. Dans la plupart des cas, il est insensé de copier tous ces objets dans le document de sortie. L'outil doit réduire ces structures de données à un sous-ensemble significatif. À titre d'exemple, seuls les contours sont copiés qui se rapportent à l'ensemble des pages du document de sortie. Pour savoir quels objets se rapportent à ce jeu de pages n'est pas toujours facile et peut nécessiter l'outil pour suivre les règles configurables.
Fusionner des pages à partir de diverses sources de documents est beaucoup plus difficile que de les diviser. Encore une fois, il est facile de copier des pages et des objets référencés. Fusionner des objets à partir des structures de données au niveau du document telles que les arborescences de contournement, les arbres de destination nommés, etc. n'est en général pas facile. C'est parce que les noms des éléments de l'arborescence provenant de différentes sources peuvent ne pas être uniques et que l'outil doit résoudre ces collisions. Pour ce faire, l'outil doit à nouveau suivre les règles configurables.
Un outil de découpage et de fusion bien élaboré est cependant capable de gérer les situations spéciales décrites ci-dessus. En plus de la fonction principale, la plupart des outils fournissent des fonctions supplémentaires utilisées dans le contexte de l'assemblage de documents. Certaines d'entre elles sont:
Déchiffrer les documents d'entrée et chiffrer les documents de sortie
Linéariser le document de sortie
Faire pivoter les pages
Agrandir et rétrécir la taille des pages