Glossaire de toutes les choses en PDF

Notre format de document portable bien-aimé (ouais, c’est ce que signifie PDF ) a juste 30 ans en 2021. Et il est devenu de plus en plus puissant au fil des ans! Trouvez les explications du dernier lingo et rejoignez le mouvement.

AES - Standard de cryptage avancé

Méthode de cryptage symétrique publiée en standard par NIST.

Annotation

Associe un objet (par exemple, un mémo, un morceau de musique ou un film) avec une position sur la page, ou représente une opportunité d'interagir avec l'utilisateur à l'aide de la souris et du clavier.

De nombreux documents PDF sont conçus d'une manière qui ne permet pas à l'utilisateur de les modifier, mais pour interagir néanmoins par l'utilisation de champs de formulaire et de cases à cocher.

Anti-aliasing

Une distorsion, ou un aliasing, peut se produire aux bords d'un objet en fonction de la résolution de l'image.

Les méthodes anti-aliasing peuvent être utilisées pour minimiser cet effet. Les bords sont lissés avec des valeurs de couleur ajustées par filtrage rétroactif.

ASCII

L'American Standard Code for Information Interchange, une convention largement utilisée pour l'encodage binaire d'un jeu spécifique de 128 caractères. Le jeu de caractères ASCII contient le caractère espace (ou vide) et les caractères suivants :

"#$%& '()*+,-. /0123456 789:;<=> ?@ABCDEF GHIJKLMN OPQRSTUV WXYZ[]^ _`abcdef ghijklmn opqrstuv wxyz~

ASN.1 - Notation de syntaxe abstraite #1

Langue de description pour la syntaxe des messages numériques. Pour l'encodage binaire des messages, les standards appropriés sont BER et DER de X.690.

BER - Règles d'encodage de base

Règles faciles à gérer pour l'encodage binaire des messages numériques.

Boolean object

Soit le mot clé true soit le mot clé false.

CA - Autorité de Certification

Émetteur accrédité de certificats.

CAdES - Signatures électroniques avancées CMS

Une norme ETSI pour la normalisation des signatures numériques basées sur le CMS.

Catalogue

L'objet de dictionnaire primaire qui contient les références directes ou indirectes à tous les autres objets du document, à l'exception de la bande-annonce, dont le catalogue ne fait pas référence.

Certificat

Un certificat est une certification électronique de l'identité d'une personne physique ou morale. Le certificat contient également une clé publique pour laquelle seule la personne possède une clé privée correspondante. Avec cette clé privée, la personne peut générer des signatures numériques. Toute personne peut vérifier cette signature à l'aide du certificat.

CMS - Syntaxe des messages cryptographiques

Format de message pour les signatures numériques basées sur PKCS#7 en utilisant la syntaxe ASN.1.

CRL - Liste de révocation du certificat

Liste des certificats révoqués publiés par l'émetteur.

Chiffrement

Les données sont chiffrées de manière à ce que les étrangers ne puissent en déduire le sens. Pour la communication entre l'expéditeur et le destinataire, le destinataire génère une paire de clés composée d'un privé et d'une clé publique. Si l'expéditeur chiffre maintenant les données avec la clé publique, seul le destinataire peut déchiffrer les données car le destinataire reste le seul propriétaire de la clé privée. Pour le chiffrement, des algorithmes comme RSA avec des longueurs de clés de 2048 bits sont utilisés. Les procédures habituelles pour les signatures numériques sont basées sur cette technologie.

Clés

Données utilisées pour chiffrer / décrire un message. Dans un système de chiffrement à clé publique, il existe une paire de clé privée et publique.

Données binaires

Une séquence ordonnée d'octets. Les images et les polices sont des exemples d'objets stockés en tant que données binaires.

DER - Règles d'encodage distinctes

Règles pour l'encodage binaire et unique des messages numériques basés sur BER.

DSA - Algorithme de signature numérique

par le NIST

DSS (Cryptography) - Norme de signature numérique

par le NIST

DSS (PDF) - Boutique de sécurité des documents

Structure dans un document PDF pour intégrer des informations de validation de signature telles que les LCR, les OCSPs et les certificats.

Document électronique

Une représentation électronique d'une compilation de texte, d'images et de données graphiques orientée vers la page ainsi que les métadonnées qui aident à identifier, comprendre et afficher les données. Les documents électroniques peuvent être reproduits sur papier ou affichés à l'écran sans perte significative d'informations.

eIDAS - Services d'identification électronique, d'authentification et de confiance

Un ensemble de normes européennes pour les transactions électroniques.

ETSI - European Telecommunications Standards Institute

Organisation européenne pour la normalisation des signatures numériques.

Écrivain conforme

Application logicielle capable d'écrire des fichiers PDF conformes à une spécification telle que [ISO 32000] ou [ISO 19005-1].

État graphique

L'élément le plus haut d'une pile de mémoire contient les paramètres qui contrôlent la représentation graphique. L'état graphique contient des informations telles que la couleur, la police, la taille de la police, la matrice de transformation courante, etc.

Flux de contenu

Un objet de datastream dont les données se composent d'une séquence d'instructions décrivant les éléments graphiques d'une page.

Fichier PDF corrompu

Un document PDF qui n'est pas correct et qui peut donc être illisible. Les causes possibles comprennent :

  • Le document n'a pas été généré correctement

  • Le document a été endommagé après sa création (ex: processus de copie incomplet)

Filtre

Composant optionnel d'une spécification de tream de données qui définit comment les données doivent être décodées avant d'être utilisées. Exemples de filtre: Flate, DCT.

Font

Identifie les collections de graphiques qui peuvent être des glyphes ou d'autres éléments graphiques [ISO 15930-4].

Un fichier de police définit comment les glyphes sont affichés. Si un fichier de police est contenu dans un fichier PDF, alors la police associée est intégrée dans le fichier.

Si la police ne contient pas un jeu de caractères complet, par exemple, seulement les glyphes des caractères utilisés dans le document, le terme utilisé est une police sous-définie.

Fonction

Un type spécial d'objet représentant une classe paramétrée, y compris des formules mathématiques et des représentations échantillonnées de résolution arbitraire.

Filtre Gaussien

Un filtre qui permet de minimiser le bruit de l'image en adoucissant ou en appliquant un effet de mise au point au cours du processus d'édition d'image.

Glyphe

Symbole graphique abstrait reconnaissable, indépendant de tout design spécifique [ISO/IEC 9541-1]. Les exemples de glyphes du caractère « A » incluent : A, A, A

Hachage

Une valeur de hachage (hachage pour court) est un nombre calculé à partir de n'importe quelle quantité de données telles que des documents, des certificats, des messages, etc. Ce nombre est souvent beaucoup plus court que les données originales (quelques octets). La valeur de hachage a la caractéristique qu'elle est la même pour les mêmes données et est presque certainement unique pour des données différentes. Les données d'origine ne peuvent pas non plus être déterminées à partir de la valeur de hachage. Pour le calcul, les algorithmes de hachage sont utilisés comme SHA-1 ou SHA-2.

HSM - Module de sécurité matérielle

Appareil de stockage sécurisé des clés privées ainsi que de chiffrement, de déchiffrement, ou la création de signatures numériques et la mise en œuvre efficace et sécurisée d'algorithmes de chiffrement et de signature.

Interpolation

Une méthode qui contrôle la combinaison de densité de pixels et de profondeur de couleur en images matricielles lors de l'édition. L'interpolation bilinéaire est une extension de l'interpolation linéaire pour la mise à l'échelle et l'affichage des textures dans les images rendues.

ISO - Organisation internationale de normalisation

Organisation internationale pour la normalisation des PDF et PDF/A, etc. La Suisse est représentée à l'ISO par l'Organe suisse de normalisation (SNV).

ISO 19005

Voir PDF/A

ISO 32000

Voir PDF.

ISO/IEC 18014

Norme ISO pour les services d'horodatage

ITU-T - Secteur de la normalisation des télécommunications de l'UIT

Coordonne les normes pour les télécommunications et est l'un des trois secteurs de l'UIT (Union internationale des télécommunications).

Jeu de caractères

Un ensemble défini de symboles, par lequel une valeur d'octet unique est affectée à chaque caractère. Exemples de caractères:

  • ASCII

  • Unicode

Lecteur conforme

Application logicielle qui peut lire et éditer un fichier PDF conforme à une spécification (par ex. [ISO 32000] ou [ISO 19005-1]), et cela est conforme aux exigences d'un lecteur conformiste.

LTV - Validation à long terme

Amélioration des signatures numériques avec des données supplémentaires afin de permettre une vérification à long terme sans services en ligne. Les données supplémentaires se composent de la chaîne de fiducie des certificats du certificat du propriétaire jusqu'au certificat racine de l'émetteur et aussi des informations qui certifient la validité des certificats au moment de la signature.

Marqueur de fin de ligne (marqueur Edl)

Une séquence de un ou deux caractères marquant la fin d'une ligne et composée de :

  • un caractère RETOUR CARRIAGE (U+000D)

  • ou un caractère LIGNE (U+000A)

  • ou un RETOUR CARRIAGE suivi directement d'une LIGNE.

MDP - Signature de la détection et de la prévention des modifications

Active la détection des modifications interdites spécifiées par l'auteur. Un document ne peut contenir qu'une seule signature MDP, qui doit être la première dans le document. D'autres types de signatures peuvent être présentes.

Nom de l'objet

Un symbole atomique défini de manière unique par une séquence de caractères commençant par un slash avant (/, U+002F), par laquelle la barre oblique avant ne fait pas partie du nom.

Nom de l'arborescence

Similaire à un dictionnaire qui associe des clés et des valeurs, où les clés dans une arborescence de noms sont des chaînes de caractères et sont ordonnées.

NIST - National Institute of Standards and Technology

L'Agence fédérale des États-Unis est responsable des processus de normalisation.

Null object

Un objet singulier de type null, désigné par le mot clé null, dont le type et la valeur sont différents de tous les autres objets.

Number tree

Similaire à un dictionnaire qui associe des clés et des valeurs, où les clés dans un arbre de nombres sont des chaînes de caractères et sont ordonnées.

Numeric object

Soit un objet entier soit un objet réel.

Objet de tableau

Une collection unidimensionnelle d'objets séquentiels avec une numérotation implicite commençant à 0.

Octets

Un groupe de 8 chiffres binaires (8 bits) qui peuvent représenter collectivement une des 256 valeurs différentes. Ces 8 chiffres binaires sont utilisés dans une multitude de périphériques électroniques d'aujourd'hui.

Objet dictionnaire

Une table associative de paires d'objets ; le premier objet est le nom de l'objet et les fonctions comme clé, le second objet est la valeur et peut être n'importe quel type d'objet, y compris un autre dictionnaire.

Objet direct

N'importe quel objet qui n'a pas été fait d'objet indirect.

Objet indirect

Un objet désigné par un entier positif suivi d'un nombre entier non négatif de génération d'entier suivi par obj et se terminant par endobj.

Objet entier

Un entier mathématique implémenté de sorte que 0 forme le centre de l'intervalle. Le nombre peut avoir un ou plusieurs chiffres et un signe facultatif.

OASIS/DSS - Organization for the Advancement of Structured Information Standards /Digital Signing Services

Une norme de l'organisation OASIS pour la signature de services basée sur la syntaxe XML.

Object

Une structure de données de base utilisée pour construire des fichiers PDF. Un objet peut être des types suivants : tableau, booléen, dictionnaire, entier, null, réel, flux de données ou chaîne de caractères.

Object reference

Une valeur d'objet qui permet de référencer un objet avec un autre. Il a le formulaire “<n> <m> R”, où <n> est un numéro d'objet indirect, <m> est son numéro de version et R est la lettre en majuscule R.

Object stream

Un datastream contenant une séquence d'objets PDF.

OCSP - Online Certificate Status Protocol

Protocole pour la requête en ligne de l'état de validité d'un certificat spécifique basé sur la syntaxe ASN.1.

Personnage

Un octet dont la valeur est généralement interprétée comme un symbole dans un jeu de symboles avec 256 membres ou moins. Exemples de caractères: 1, 2, a, b, A, &, etc.

Produit conforme

Application logicielle qui est à la fois un lecteur conforme et un rédacteur conformiste.

Profil ICC

Le profil de couleur est conforme à la spécification ICC [ISO 15076-1:2005].

Polices multi-maîtres

Variante du format PostScript Type 1, qui permet toutes les variations possibles d'affichage d'une police spécifique. D'autres éléments tels que l'épaisseur des lignes et les proportions peuvent être ajustés en fonction des spécifications communes.

PAdES - PDF Advanced Electronic Signature Profiles

Une norme ETSI pour la structure des signatures CMS et leur intégration dans des documents PDF.

PDF

Un format de fichier standardisé par ISO (ISO-32000) pour l'échange de documents. Pour les applications PDF fréquentes, il existe des sous-normes spéciales telles que PDF/A (ISO-19005) pour l'archivage des documents numériques.

PDF/A

Format de fichier Portable Document Format pour l'archivage, défini dans [ISO 19005]. Décrit les exigences que les documents PDF doivent remplir pour se conformer aux normes PDF/A-1a et PDF/A-1b. Les exigences de base de PDF/A-1b sont:

  • Conformité avec PDF Version 1.4

  • Intégration de toutes les polices utilisées pour le texte visible

  • Intégrer les profils de couleurs si spécifié par l'espace de couleur utilisé

  • Pas de chiffrement

  • Pas de transparence

Ce qui suit s'applique en plus à PDF/A-1a :

  • Encodage du texte en UNICODE

  • Les informations structurelles doivent exister (tagging)

PIN - Personal Identification Number

Code secret requis pour l'accès à un jeton.

PKCS - Public Key Cryptography Standards

Une série de normes de propriété de RSA Security Incorporated. Les normes les plus courantes sont : le cryptage des signatures (PKCS#1), le format des messages pour les signatures (PKCS#7), interface au jeton (PKCS#11), et format de fichier pour les clés et les certificats (PKCS#12).

PKI - Public Key Infrastructure

Système qui crée, stocke et vérifie une paire d'une clé privée et d'une clé publique.

Paquet XMP

Enveloppe structurée pour les métadonnées XML sérialisées qui peuvent être intégrées dans différents formats de fichiers.

QES

Signature électronique qualifiée

Raccourci

Le hinting est une méthode qui améliore la qualité d'affichage des polices en optimisant les contours lors de l'affichage des caractères.

ROC

La reconnaissance optique des caractères (lecteur de caractères optique, OCR) est la conversion mécanique ou électronique des images de saisie, texte manuscrit ou imprimé en texte, que ce soit à partir d'un document numérisé ou d'une photo d'un document.

Real object

Des nombres réels mathématiques approximatifs, mais avec une portée et une précision limitées et écrite comme un ou plusieurs chiffres avec un signe optionnel et un point décimal optionnel.

Rectangle

Un objet de tableau spécifique qui définit la position et les boîtes englobantes sur une page pour différents objets. Il est représenté par un tableau de 4 nombres désignant les paires de coordonnées de deux coins opposés en diagonale, généralement sous la forme [en bas à gauche X, Y, en haut à droite X, Y].

Resource dictionary

Associe les ressources avec les noms, utilise les objets dans les flux de données de contenu avec les objets de la ressource eux-mêmes et les organise dans différentes catégories (e. . police de caractères, espace couleur, motif).

Signature, signing

Données avec lesquelles l'intégrité et, éventuellement, l'authenticité d'un document peuvent être assurées. La signature est essentiellement faite comme suit : la valeur de hachage est formée à partir des données à signer et à chiffrer avec la clé privée. La signature est emballée dans un message CMS accompagné de certificats et d'autres informations.

Space character, white-space character

Caractère de texte utilisé pour représenter un espace blanc orthographique. Comprend les caractères suivants :

  • TABULATION HORIZONTAL (U+0009)

  • FRAIS DE LIGNE (U+000A)

  • TABULATION VERTICALE (U+000B)

  • FAÇON DE FORME (U+000C)

  • RETOUR DE CARRIAGE (U+000D)

  • ESPACE (U+0020)

  • ESPACE DE NOBREAK (U+00A0)

  • EN ESPACE (U+2002)

  • EM SPACE (U+2003)

  • ESPACE DE FIGURE (U+2007)

  • ESPACE DE PONCTUATION (U+2008)

  • THIN SPACE (U+2009)

  • ESPACE DE CHEVEUX (U+200A)

  • ZERO WIDTH SPACE (U+200B)

  • ESPACE IDEOGRAPHIQUE (U+3000)

Stream object

Contient un dictionnaire suivi par zéro ou plus de parenthèses par le flux de mots clés et le flux de fin.

String object

Contient une série d'octets (valeurs entières non signées allant de 0 à 255). Les octets ne sont pas des objets entiers, mais sont stockés sous une forme plus compacte.

Tableau de référence croisée

Structure de données contenant le début du décalage d'octets pour tous les objets indirects du fichier.

TLS - Transport Layer Security

Développement ultérieur de Secure Sockets Layer (SSL), un protocole de cryptage hybride pour la transmission sécurisée de données sur Internet.

Token

Un « conteneur» (partie du HSM, clé USB, carte à puce, etc.) qui contient des clés privées et protège contre les accès non autorisés. Pour des raisons pratiques, le jeton contient aussi souvent des certificats et des clés publiques correspondantes, qui n'ont pas besoin d'être protégées.

Transparence

Dans un PDF, les objets graphiques sont appliqués sur une page en séquence, où chaque objet est composé avec l'arrière-plan déjà présent. Initialement, cet arrière-plan n'est que la page vide et, par la suite, il est composé de tous les objets composés ajoutés jusqu'à présent. En plus des objets, une page définit un mode de composition pour chaque objet. Selon ce mode, l'arrière-plan sous-jacent se mélange soit de manière transparente avec le nouvel objet, soit il est couvert de manière opaque. En général, la présence ou l'absence de transparence sur une page PDF ne peut pas être facilement détectée à la main. Mais une certaine transparence n’est pas autorisée lorsque vous travaillez avec des formats PDF/A-1, donc la conversion d’un PDF avec transparence en PDF/A-1 peut causer des différences visuelles. Les normes PDF/A-2, A-3 et A-4 permettent en revanche la transparence.

TSA - Time Stamp Authority

Fournisseur accrédité de services de timbre horaire.

TSP - Time Stamp Protocol

Protocole pour la récupération en ligne des timbres temporels cryptographiques basé sur la syntaxe ASN.1.

Unicode

Norme internationale attribuant une valeur unique à chaque caractère ou élément de texte significatif. Le jeu de caractères universel [ISO 10646] est pratiquement équivalent à toutes les extensions.

Verification, verifying

Vérification de la validité d'une signature numérique. Une signature est vérifiée comme suit : la signature est déchiffrée avec la clé publique. La valeur de hachage contenue dans le message de signature est comparée à la valeur de hachage calculée à partir des données signées. Si les hashes correspondent alors la signature est valide.

Version

Indique la référence PDF utilisée pour générer le document. Le logiciel de traitement PDF doit supporter cette version pour garantir un traitement correct. Les versions PDF vont de 1.0 à 1.8 (comme pour 2009). PDF 1.4 correspond à Acrobat 5, PDF 1.8 correspond à Acrobat 9.

Web capture

Indique le processus de génération de contenu PDF en important et éventuellement en convertissant des fichiers à partir d'Internet ou de fichiers locaux. Les fichiers peuvent être importés dans n'importe quel format tel que HTML, GIF, JPEG, texte et PDF.

WebAssembly

WebAssembly (souvent abrégé en "Wasm") est un format de données portable pour le code binaire qui peut être exécuté dans un environnement d'exécution approprié, par exemple dans un navigateur Web. Contrairement à JavaScript, le code est sous une forme binaire hautement optimisée qui est proche du matériel, ce qui fournit un avantage significatif sur les performances. Le W3C (World Wide Web Consortium) a lancé la norme en 2017 dans le but d’abstractiver, d’optimiser et de soutenir plus largement sa technologie prédécesseur, asm.js. Puisque WebAssembly est une cible de compilation, différents langages de programmation peuvent être utilisés.

X.509

Norme ITU-T pour une infrastructure à clé publique afin de créer des certificats numériques basés sur la syntaxe ASN.1.

X.690

ITU-T Standard for encoding digital messages based on the ASN.1 syntax: Basic Encoding Rules (BER), Canonical Encoding Rules (CER) and Distinguished Encoding Rules (DER).

XAdES - XML Advanced Electronic Signatures

Une norme ETSI pour la création de signatures et leur intégration dans les données XML.

XML - Extensible Markup Language

Format pour l'échange de données hiérarchiquement structurées sous forme de texte entre machines.