PDF/A und Durchsuchbarkeit beim Bundesministerium für Justiz
Das Ziel des Projektes war, die Konvertierung in das Format PDF/A-1b sowie die Texterkennung der Dokumente. Langfristig soll die Verpflichtung der Einbringung in PDF/A-1b die derzeitige Vorgabe zu PDF 1.4 ersetzen und die PDF/A-Umwandlung einer Validierung weichen.
Ausgangslage
Die österreichische Justiz erhält täglich auf elektronischem Weg (Bürgerservice, elektronischer Rechtsverkehr) PDF-Dokumente. Die Durchsuchbarkeit dieser Dokumente war jedoch auf technischem Weg nicht realisierbar. Das Ziel des Projektes war, die Konvertierung in das Format PDF/A-1b sowie die Texterkennung der Dokumente. Langfristig soll die Verpflichtung der Einbringung im Format PDF/A-1b die derzeitige Vorgabe zu PDF 1.4 ersetzen und die PDF/A-Umwandlung einer Validierung weichen.
Kundennutzen
Durch die Bereitstellung des 3-Heights® PDF to PDF/A Converters der PDF Tools AG und der ABBYY OCR Engine als zentrale Services kann jetzt justizweit jedes Dokument nach PDF/A konvertiert und elektronisch durchsuchbar gemacht werden. Dank der Java API des PDF/A Konverters konnte die BRZ das Produkt einfach und schnell in ihre Umgebung integrieren. ABBYY hat auch bei mittelmässiger Auflösung der Eingangsdokumente eine hohe Zeichenerkennungsrate und ermöglicht damit die automatisierte, elektronische Weiterverarbeitung der in den Dokumenten enthaltenen Texte.
Umsetzung
Im Rahmen einiger Tests hat sich die Kombination des 3-Heights® PDF to PDF/A Converters zusammen mit ABBYY als OCR Engine als beste Lösung für das Bundesrechenzentrum herausgestellt. Die primären Anforderungen waren die Stabilität der eingesetzten Produkte sowie eine hohe PDF/A Konvertierungsquote und Zeichenerkennungsrate der OCR Engine. Ebenso wichtig war die Skalierbarkeit der verwendeten Tools, um auch mit den erwarteten grossen Datenmengen umgehen zu können. Täglich erzeugt die österreichische Justiz Tausende PDF Dokumente auf verschiedene Art und Weise. Diese Dateien werden über mehrere Kanäle eingebracht und müssen korrekt verarbeitet werden. Der 3-Heights® PDF to PDF/A Converter von PDF Tools konnte zusammen mit ABBYY alle Anforderungen erfüllen.