Die Automatisierung der Konvertierung von Microsoft Office-Dokumenten in PDF/A

Ein zentraler Dienst zur Konvertierung von Microsoft Office-Dokumenten in PDF oder PDF/A hat offensichtliche Vorteile. Die Konvertierung erfolgt auf einer unternehmensweiten Plattform mit gut definierten Softwareversionen und Konfigurationsprozessen für die Konvertierung. Dies gewährleistet eine konsistente Qualität und macht den Einsatz und Betrieb von clientbasierter Software überflüssig. Der Preis dafür ist jedoch, dass der zentrale Dienst die nativen Anwendungen automatisieren muss, wie z.B. Microsoft Word, die für die interaktive Nutzung und nicht für den Serverbetrieb konzipiert sind. Wenn ich einen solchen Dienst aufbauen müsste, wäre mein erster naiver Ansatz, den Dienst die folgenden Automatisierungsschritte durchführen zu lassen: Führen Sie die Anwendung aus und rufen Sie die Funktionen "Datei öffnen" und "Als PDF/A speichern" auf. Leider ist das nicht so einfach. Warum nicht?

Anwendungen wie Microsoft Word, Excel und PowerPoint sind für die interaktive Nutzung konzipiert. Sie können nur als eine einzige Instanz in einer Benutzersitzung ausgeführt werden. Ein Dienst muss jedoch darauf vorbereitet sein, Dokumente parallel zu konvertieren, um die Computerressourcen optimal zu nutzen. Dann benachrichtigen die meisten Anwendungen den Benutzer mit Popup-Dialogfeldern und ähnlichen Benutzeroberflächenelementen. Wenn dies im Kontext eines Dienstes geschieht, blockieren die Anwendungen den Prozess, da es keinen Benutzer gibt, der die Schaltflächen OK und Abbrechen drücken kann. Darüber hinaus sind interaktive Anwendungen nicht robust genug, um Tausende von Dokumenten zu verarbeiten. Sie werden nach einer Weile instabil und müssen beendet werden. Schließlich entspricht die Qualität des produzierten PDF/A-Dokuments manchmal nicht dem Standard oder ist von schlechter visueller Qualität.

Aus diesen Gründen muss ein Dienst zur Automatisierung der Konvertierung von Microsoft Office-Dokumenten in PDF/A viel mehr tun, als ich oben in meinem naiven Ansatz beschrieben habe. Die wichtigsten Aufgaben sind:

  • Führen Sie die Anwendung in mehreren Instanzen einer "Arbeitersitzung" aus. Dies ermöglicht die Ausführung von Konvertierungen parallel.

  • Automatisieren Sie den Konvertierungsprozess, indem Sie die Anwendung über eine API steuern, und führen Sie einen "Roboter" aus, der die Benutzeroberfläche der Anwendung bedient (Schaltflächen OK drücken, Nachrichten lesen und entsprechend handeln usw.).

  • Überwachen Sie die Gesundheit der Anwendungen und starten Sie sie entsprechend neu.

  • Verwenden Sie die optimalen Mittel, um eine PDF-Datei zu erstellen und sie als Nachbearbeitungsschritt in eine PDF/A-Datei zu konvertieren. Einige Anwendungen haben eine integrierte Funktion "Als PDF speichern", andere können an einen virtuellen Druckertreiber drucken, und einige können ein Dateiformat (XPS, PostScript usw.) erzeugen, das in PDF/A konvertiert werden kann.

Die Konvertierung ist nicht die einzige Funktion, die ein solcher Dienst bieten kann. Sobald der Dienst ein Dokument erhält, kann er einige zusätzliche, sehr nützliche Nachbearbeitungsschritte bieten. Hier sind einige davon:

  • Dokumente zusammenführen

  • Digitale Signaturen anwenden

  • XML-Daten in elektronische Rechnungsdokumente einbetten (ZUGFeRD-Standard)

  • XMP-Metadaten einbetten

  • Stempeln

Gefällt Ihnen, was Sie sehen? Teilen Sie es mit einem Freund.

Grüezi! Wie können wir helfen?

Phone