Automatisation de la conversion des documents Microsoft Office en PDF/A
Un service central de conversion de documents Microsoft Office en PDF ou PDF/A présente des avantages évidents. La conversion se fait sur une plate-forme à l'échelle de l'entreprise avec des versions logicielles bien définies et des configurations de processus de conversion. Cela garantit une qualité constante et rend le déploiement et le fonctionnement de logiciels basés sur le client obsolète. Cependant, le prix à payer est que le service central doit automatiser les applications natives, tels que Microsoft Word, qui sont conçus pour une utilisation interactive et non pour le fonctionnement du serveur. Si je devais construire un tel service, ma première approche naïve serait de laisser le service effectuer les étapes suivantes : Exécutez l'application et appelez le « fichier ouvert » et les fonctions « Enregistrer en tant que PDF/A ». Malheureusement, ce n'est pas aussi facile. Pourquoi pas?
Les applications telles que Microsoft Word, Excel et PowerPoint sont conçues pour une utilisation interactive. Ils ne peuvent s'exécuter qu'en tant qu'instance unique dans une session utilisateur. Un service doit toutefois être prêt à convertir des documents en parallèle pour faire un usage optimal des ressources informatiques. Ensuite, la plupart des applications notifient l’utilisateur avec des boîtes de dialogue pop-up et des fonctions d’interface utilisateur similaires. Si cela se produit dans le contexte d'un service, les applications bloqueront le processus parce qu'il n'y a aucun utilisateur pour appuyer sur les boutons OK et Annuler. En outre, les applications interactives ne sont pas assez robustes pour traiter des milliers de documents. Ils deviennent instables après un certain temps et doivent être terminés. Enfin, la qualité du document PDF/A produit n'est parfois pas conforme à la norme ou de qualité visuelle inférieure.
Pour ces raisons, un service d'automatisation de la conversion de Microsoft Office Documents en PDF/A doit faire beaucoup plus que ce que j'ai décrit ci-dessus dans mon approche naïve. Les tâches les plus importantes sont:
Exécutez l'application dans plusieurs instances d'une « session worker ». Cela permet l'exécution de conversions en parallèle.
Automatisez le processus de conversion en contrôlant l'application à travers une API et exécutez un "robot" pour gérer l'interface utilisateur de l'application (appuyez sur les boutons OK, lire les messages et agir selon eux, etc.).
Surveillez l'état de santé des applications et redémarrez-les en conséquence.
Utilisez les moyens optimaux pour créer un fichier PDF et le convertir en fichier PDF/A comme étape de post-traitement. Certaines applications ont une fonction intégrée "Enregistrer en tant que PDF", d'autres peuvent imprimer dans un pilote d'imprimante virtuel et certains peuvent produire un format de fichier (XPS, PostScript, etc.). qui peuvent être convertis en PDF/A.
La conversion n'est pas la seule fonction qu'un tel service peut fournir. Une fois que le service est en possession d'un document, il peut fournir quelques étapes supplémentaires et très utiles après le traitement. Voici quelques-unes d'entre elles:
Fusion des documents
Appliquer les signatures numériques
Intégrer les données XML dans les documents de facture électronique (norme ZUGFeRD)
Intégrer les métadonnées XMP
Tamponnage