PDF Extract

Alle Funktionen und Werkzeugmöglichkeiten auf einen Blick

Linux
MacOS
Windows-Client
Windows-Server
API
Shell-Tool (Befehlszeile)
.NET Core
Java
C#
C/C++

Kurze Fakten

Übereinstimmung

  • ISO 32000-1 (PDF 1.7)

  • ISO 32000-2 (PDF 2.0)

  • ISO 19005-1 (PDF/A-1)

  • ISO 19005-2 (PDF/A-2)

  • ISO 19005-3 (PDF/A-3)

Unterstützte Formate

  • PDF 1.0 bis 1.7

  • PDF 2.0

  • PDF/A-1, PDF/A-2, PDF/A-3

Funktionen

Text extrahieren

  • Konfigurieren Sie die Erkennung von Wortgrenzen, Wort für Wort

  • Rufen Sie Textattribute wie Position, Schriftart und Schriftgröße ab

  • Automatisch die korrekte Zeichencodierung anwenden und Unicode-Ausgabe erzeugen

  • Roh-Zeichencodes extrahieren

Grafikobjekte (Pfad) extrahieren

  • Extrahieren als Strings, die PDF-Grafikoperatoren enthalten

  • Konvertierte extrahierte Pfade in Bilder

Bilder extrahieren und speichern

  • Abrufen von Bildattributen wie Kompressionsformat, Position und Transparenzmasken

  • Transparenzmasken extrahieren und speichern

  • Alternative Bilder extrahieren und speichern

PDF-Dokumentenebene Informationen extrahieren

  • Seitenanzahl

  • PDF-Version

  • Seitenbeschriftungen

  • Erstellungs- und Änderungsdatum

  • Dokumentinformationen wie Titel, Autor, Themen und mehr

  • Inhaltsverzeichnisse (Lesezeichen), einschließlich Ziele

Seiteninformationen extrahieren

  • Medienbox, Zuschnittbox, Schnittbox, Beschnittbox und Kunstbox

  • Seitenrotation

  • Anmerkungen

Zusätzliche Funktionen

  • Extrahieren und speichern von eingebetteten Schriftdateien

  • Detaillierte Schriftinformationen abrufen

  • Optionale Inhaltsgruppen (OCG) Informationen und Sichtbarkeit (Ebenen) abrufen

  • Detaillierte Grafikzustandsinformationen für jedes extrahierte Seiteninhaltsobjekt abrufen

  • Rohe PDF-Objekte extrahieren

  • Dokumentteile für PDF/X oder PDF 2.0 extrahieren

  • Detaillierte Farbräumeninformationen einschließlich Nachschlagetabellen für indizierte Farbräume abrufen

  • Extrahieren und speichern von eingebetteten Dateien

  • Ein Passwort angeben, um PDF-Dateien zu entschlüsseln