PDF Extract

Alle Funktionen und Werkzeugmöglichkeiten auf einen Blick

Linux
MacOS
Windows Client
Windows Server
API
Shell tool (command line)
.NET Core
Java
C#
C/C++

Kurze Fakten

Übereinstimmung

  • ISO 32000-1 (PDF 1.7)

  • ISO 32000-2 (PDF 2.0)

  • ISO 19005-1 (PDF/A-1)

  • ISO 19005-2 (PDF/A-2)

  • ISO 19005-3 (PDF/A-3)

Unterstützte Formate

  • PDF 1.0 bis 1.7

  • PDF 2.0

  • PDF/A-1, PDF/A-2, PDF/A-3

Funktionen

Text extrahieren

  • Wortgrenzen-Erkennung konfigurieren, Wort für Wort

  • Rufen Sie Textattribute wie Position, Schriftart und Schriftgröße ab

  • Automatisch die korrekte Zeichencodierung anwenden und Unicode-Ausgabe erzeugen

  • Rohzeichen-Codes extrahieren

Grafikobjekte (Pfad) extrahieren

  • Strings extrahieren, die PDF-Grafikoperatoren enthalten

  • Extrahierte Pfade in Bilder konvertieren

Bilder extrahieren und speichern

  • Abrufen von Bildattributen wie Kompressionsformat, Position und Transparenzmasken

  • Transparenzmasken extrahieren und speichern

  • Alternative Bilder extrahieren und speichern

PDF-Dokumentebene-Informationen extrahieren

  • Seitenanzahl

  • PDF-Version

  • Seitenbeschriftungen

  • Erstellungs- und Änderungsdatum

  • Dokumentinformationen wie Titel, Autor, Themen und mehr

  • Inhaltsverzeichnisse (Lesezeichen), einschließlich Ziele

Seiteninformationen extrahieren

  • Medienbox, Zuschnittbox, Schnittbox, Beschnittbox und Kunstbox

  • Seitenrotation

  • Anmerkungen

Zusätzliche Funktionen

  • Extrahieren und Speichern eingebetteter Schriftdateien

  • Detaillierte Schriftinformationen abrufen

  • Rufen Sie Informationen und Sichtbarkeit der optionalen Inhaltsgruppen (OCG) ab

  • Rufen Sie detaillierte Grafikzustandsinformationen für jedes extrahierte Seiteninhaltsobjekt ab

  • Rohe PDF-Objekte extrahieren

  • Dokumentteile für PDF/X oder PDF 2.0 extrahieren

  • Detaillierte Informationen zum Farbraum Abrufen einschließlich Nachschlagetabellen für indizierte Farbräume

  • Extrahieren und Speichern von eingebetteten Dateien

  • Ein Passwort angeben, um PDF-Dateien zu entschlüsseln