Qu’est-ce que la compression et l’optimisation des PDF ?
La plupart des gens s'accordent à dire que la compression et l'optimisation de PDF ont quelque chose à voir avec la réduction de la taille des fichiers. Parfois, il s'agit d'un rendu plus rapide. Quoi qu'il en soit, la compression et l'optimisation sont un sujet large et cela vaut certainement la peine d'être plus proche.
La compression et l'optimisation ont été un sujet important depuis le début. Les trois premières éditions du célèbre manuel de référence PDF consacré pas moins de quatre chapitres sur ce sujet. Vous pouvez trouver des conseils très utiles dans ceux-ci, soit dit en passant, que je peux fortement recommander à tous les fabricants de logiciels PDF. Mais il y a, en dehors de la création optimale de fichiers, d'autres fonctions de traitement de documents, telles que la fusion, la préparation d'impression, etc. où l'optimisation intervient.
Au lieu d'entrer dans trop de détails, permettez-moi d'énumérer les domaines d'optimisation les plus importants:
Objets inutilisés, qui ont été remplacées par des versions plus récentes ou ne sont pas du tout utilisées ou décrivent une valeur par défaut, etc. peuvent être supprimés en toute sécurité.
Objets redondants, qui ont une structure identique peut être fusionnée en une seule instance. Cependant, cela ne fonctionne que pour des types d'objets spécifiques tels que les ressources, les flux de contenu, etc. Mais cela ne s'applique pas aux objets dont l'instance représente un attribut implicite comme les objets de page, les éléments d'arborescence, etc.
Objets non désirés, qui ne sont pas nécessaires pour le but du fichier peut être ignoré. Par exemple, un fichier à imprimer n'a pas besoin de fils d'article, d'informations de capture web et autres.
Images peut être réduite en taille en réduisant leur résolution à la résolution des périphériques cibles ou en utilisant des algorithmes de compression plus puissants. En particulier avec les techniques d’images scannées telles que le contenu mixte de raster (MRC) peut réduire la taille du fichier de manière significative. Je publierai un article séparé à ce sujet plus tard.
Polices intégrées peut être optimisé en compilant des sous-ensembles de glyphes ou en fusionnant différentes instances du même programme de police en une seule fois. Certains processus d'impression nécessitent que le programme de police intégré soit supprimé et remplacé par la police installée.
Transparence est souvent un défi pour les périphériques d'imprimante et un must avant que le document ne soit converti en un langage d'imprimante, tel que PostScript ou PCL. L'aplanissement de la transparence, c'est-à-dire le remplacement des objets transparents par des objets opaques, implique dans la plupart des cas une rastérisation dans la résolution de l'appareil. L'aplanissement augmente la taille du fichier dans la plupart des cas.
Compression est un moyen générique de réduire la taille des flux. Depuis la version 1.5 des objets et des informations de référence croisée peuvent être placés dans des flux compressés pour économiser de l'espace. Les objets appropriés sont les objets sans flux qui ne sont pas utilisés pour le rendu comme les contours, la structure du document, etc.
Linéarisation ajoute des informations pour une visualisation rapide du Web et ne réduit donc pas la taille du fichier. Je publierai un article sur ce sujet plus tard.
En plus de ce qui précède, certains outils offrent des fonctions plus sophistiquées mais quelque peu risquées, telles que:
Conversion de couleurs du texte, des chemins et des images n'est pas aussi simple qu'il n'y paraît. En particulier si la transparence ou la surimpression est concernée, alors la conversion de couleur peut devenir un cauchemar.
Objets invisibles qui sont entièrement couverts par d'autres objets opaques ou clippés peuvent être supprimés ce qui n'est pas désiré si le document doit être édité plus tard.
Coalescence de l'opérateur est utilisé pour réduire le nombre d'opérateurs utilisés et accélérer le rendu.