Bildkennung in gescannten Bildern

Die Erkennung von Bildern in gescannten Dokumentseiten bietet viele Vorteile, wie z. B. bessere Kompressionsraten und die Möglichkeit, sie einzeln zu extrahieren.

Eine gescannte Seite ist ursprünglich ein Rasterbild, das aus zweiwertigen oder Farbpixeln besteht. Da wir über ausgeklügelte Kompressionsmethoden verfügen, ist das Scannen in Farbe eindeutig der bevorzugte Weg gegenüber reinem Schwarz-Weiß-Modus. Eine solche Methode ist die gemischte Rasterinhaltsmethode (MRC), die das gescannte Bild in eine Hintergrund-, Masken- und Vordergrundschicht trennt. Jede Schicht kann individuell mit speziellen Algorithmen komprimiert werden, die für ihren spezifischen Zweck parametrisiert sind. Solche Algorithmen sind JBIG2 für die Maske und JPEG2000 für die Hintergrundschicht. 

Es kann mehrere Vordergrundschichten geben, z. B. für fotografische Bilder, die Teil der gescannten Seite sind. Um diese Bilder vom Hintergrund- und Maskenlayer zu trennen, muss ein spezifischer Segmentierungsalgorithmus sie erkennen und isolieren. Jedes dieser Bilder kann jetzt eine individuelle Vordergrundschicht bilden, die mit einem spezifischen Algorithmus wie JPEG komprimiert wurde.

Die MRC-Methode für gescannte Seiten kann wie folgt durchgeführt werden:

  • Segmentierungsalgorithmus: Bilder erkennen und isolieren

  • Trennalgorithmus: Berechnen Sie die Pixel der Bildmaske und des Farbhintergrunds.

  • Jede Schicht mit einem speziellen Kompressionsalgorithmus komprimieren

  • Die Schichten gemäß einem MRC-Schema wie RFC 2301 im TIFF oder einem maskierten Bild im PDF zusammensetzen.

Das Entfernen von Bildern von der gescannten Seite kann auch den Textverarbeitungsprozess (OCR) beschleunigen. 

Es kann jedoch eine interessantere Funktion angeboten werden. Wenn die genannten Bilder isoliert und einer einzelnen Schicht zugeordnet wurden, können sie mit einem geeigneten Tool leicht aus dem Dokument extrahiert werden.

Darüber hinaus kann beim Erstellen eines PDF-Dokuments aus einer gescannten Seite die optionale Inhaltsfunktion verwendet werden, um die Hintergrund- und Vordergrundschichten ein- und auszuschalten.

Unsere Produkte wie die 3-Heights™ TIFF Toolbox, der 3-Heights™ Scan Server und der 3-Heights™ Optimizer unterstützen jetzt die Funktionen beschrieben in diesem Artikel. Um die Bilder aus einem PDF-Dokument zu extrahieren, kann das 3-Heights™ PDF Extract-Tool verwendet werden.

Gefällt Ihnen, was Sie sehen? Teilen Sie es mit einem Freund.

Grüezi! Wie können wir helfen?

Phone