Importation d'images dans un fichier PDF - une tâche apparemment triviale
Une image vaut mille mots. C'est pourquoi ils sont foncièrement incorporés dans des fichiers PDF. On pourrait s'attendre à ce que l'intégration des images dans un fichier PDF soit une tâche simple. Parce que cela semble si facile, il y en a aussi beaucoup, y compris des outils gratuits. Mais ces outils font-ils ce que vous attendez d'eux? Un regard de plus près révèle que les images incorporées sont tout sauf triviales.
Commençons par intégrer les données d'image au format JPEG populaire. De nombreux programmes de création de PDF prennent simplement le flux de données JPEG et l'intègrent comme dans le fichier PDF. Cela fonctionne-t-il simplement? La réponse est: dans la plupart des cas, mais pas toujours. La norme PDF exige que seuls les JPEG de base soient intégrés. Mais il y a aussi des JPEG dits multi-scans, progressifs et encodés arithmétiquement. Ils ne sont pas autorisés et ne peuvent alors pas être affichés par de nombreux lecteurs PDF. Le fait qu'Acrobat affiche de tels fichiers PDF sans message d'erreur n'empêche pas leur diffusion. Ceci est particulièrement gênant lorsque le fichier prétend se conformer à PDF/A, car de nombreux outils de validation PDF n'examinent pas les flux d'images pour se conformer à la norme.
Il devient tout aussi problématique si les flux d'images G3 de fax sont transférés d'un conteneur TIFF vers un fichier PDF. Les spécifications du TIFF et du PDF sont, pour quelque raison que ce soit, un peu différentes, de sorte que ce projet peut mal tourner.
Lors de l'intégration des données de l'image, le format de la source de l'image doit être soigneusement analysé et le flux de données converti ou même recompressé pour se conformer à la spécification PDF.
Mais il y a d'autres raisons de modifier le flux d'image. Les flux JPEG contiennent aussi souvent de nombreux segments qui ne sont pas nécessaires en PDF ou qui doivent être stockés à un autre endroit. Par exemple, les données Exif (paramètres de caméra, localisation GPS, etc.) doit être extrait, converti au format XMP et assigné à l'objet image en tant que propriété distincte. D'autres segments, comme les données privées de Photoshop, peuvent également être supprimés parce qu'ils n'ont pas d'utilité et ne prennent que beaucoup d'espace.
En dehors du flux d'image, il ya aussi d'autres informations dans les images source qui doivent être transférées dans le fichier PDF, mais est souvent oublié. Typiquement, ce sont des profils de couleurs et des métadonnées. Mais ce n'est pas si simple. Puisque les fichiers TIFF et autres formats d'image ne peuvent pas être directement intégrés dans le fichier PDF, les conteneurs doivent être déconditionnés et convertis de manière à pouvoir être transférés dans le fichier PDF. Par exemple, les informations contenues dans le fichier TIFF sont stockées dans des balises qui contiennent des métadonnées en plus des données de l'image. Ces métadonnées doivent d'abord être converties au format XMP avant d'être intégrées dans le fichier PDF. C'est similaire avec les couleurs. Souvent, les descriptions des espaces de couleurs ne sont pas simplement stockées en tant que profils de couleurs et doivent être converties en une description de l'espace de couleur PDF.
Il y a donc beaucoup de petits détails à considérer qui ne sont pas correctement ou du tout gérés par de nombreux outils. Il vaut donc la peine d'utiliser un outil professionnel pour une tâche apparemment banale.
Une image vaut mille mots. Cependant, il est certainement nécessaire d'écrire plus d'un millier de mots sur la manière dont les images doivent être intégrées correctement dans un fichier PDF.