PDF Extract

Toutes les fonctionnalités et les possibilités d'outils en un coup d'œil

Linux
MacOS
Client Windows
Serveur Windows
API
Outil Shell (ligne de commande)
.NET Core
Java
C#
C/C++

Faits courts

Conformité

  • ISO 32000-1 (PDF 1.7)

  • ISO 32000-2 (PDF 2.0)

  • ISO 19005-1 (PDF/A-1)

  • ISO 19005-2 (PDF/A-2)

  • ISO 19005-3 (PDF/A-3)

Formats supportés

  • PDF 1.0 à 1.7

  • PDF 2.0

  • PDF/A-1, PDF/A-2, PDF/A-3

Fonctionnalités

Extraire le texte

  • Configurer la détection des limites de mots, avec mot par mot

  • Récupérer les attributs du texte tels que la position, la police et la taille de la police

  • Appliquer automatiquement le décodage de caractères correct et produire une sortie Unicode

  • Extraire les codes de caractères bruts

Extraire des objets graphiques (chemins)

  • Extraire en tant que chaînes qui contiennent des opérateurs graphiques PDF

  • Convertir les chemins extraits en images

Extraire et stocker les images

  • Récupérer les attributs d'image tels que le format de compression, la position et les masques de transparence

  • Extraire et stocker les masques de transparence

  • Extraire et stocker les images alternatives

Extraire les informations au niveau du document PDF

  • Nombre de pages

  • Version PDF

  • Étiquettes de page

  • Date de création et de modification

  • Informations sur le document telles que le titre, l'auteur, les sujets et plus

  • Contours (signets), destinations incluses

Extraire les informations de la page

  • Boîte de média, boite de recadrage, boite de découpe, boîte de fond de fond et boite de dessin

  • Rotation des pages

  • Annotations

Fonctionnalités supplémentaires

  • Extraire et stocker les fichiers de police intégrés

  • Récupérer les informations de police détaillée

  • Récupérer les informations optionnelles du groupe de contenu (OCG) et la visibilité (calques)

  • Récupérer les informations d'état graphique détaillé pour chaque objet de contenu de page extrait

  • Extraire les objets PDF bruts

  • Extraire les pièces de document pour PDF/X ou PDF 2.0

  • Récupérer les informations détaillées sur l'espace de couleur, y compris les tables de recherche pour les espaces de couleurs indexés

  • Extraire et stocker les fichiers intégrés

  • Spécifiez un mot de passe pour déchiffrer les fichiers PDF