Behandlung von eingebetteten und nicht eingebetteten Schriftarten in PDF- und PDF/A-Dokumenten
Obwohl der erste Teil des PDF/A-Standards 2005 veröffentlicht wurde, besteht weiterhin Bedarf an einigen Klarstellungen bezüglich Schriftarten und Einbettung. Was verlangt der Standard genau? Wie sollten PDF-zu-PDF/A-Konverter mit Schriftarten umgehen? Wie gehen Viewer tatsächlich mit ihnen um und wie sollten sie es tun?
PDF/A-Erstellung
Lass uns mit dem einfachsten Fall beginnen. Wenn Sie ein PDF/A-Dokument erstellen, müssen Sie im Allgemeinen alle verwendeten Schriften einbetten. Das gilt für jede Variante von PDF/A, wie PDF/A-1b oder PDF/A-3u usw. Es gibt nur eine Ausnahme. Wenn der Text nicht sichtbar ist (Textdarstellungsmodus 3), ist das Einbetten nicht erforderlich. Unsichtbarer Text wird oft verwendet, um eine gescannte Seite mit dem Text einer OCR-Engine zu überlagern, um die Suche nach Text in einem gescannten Dokument zu ermöglichen, als ob es ein digital geborenes Dokument wäre.
Wenn das Einbetten erforderlich ist, kann die Schriftart jedoch minimiert werden, sodass sie nur die Zeichen enthält, die im Dokument verwendet werden, z. B. wenn ein Dokument die einzelne Textzeichenfolge „help“ in Arial anzeigt, kann das eingebettete Arial-Schriftprogramm auf nur vier Zeichen reduziert werden. Dieser Prozess wird Subsetting genannt und wird umfassend verwendet, um die Größe der erstellten Datei zu reduzieren.
Aber die Ersteller müssen auf einige Zeichen achten, die aus anderen zusammengesetzt sind, wie das deutsche Zeichen „ä“, das aus dem Zeichen „a“ und „¨“ zusammengesetzt werden kann. Dies ist eine der Quellen für schlechte PDFs mit unvollständigen Schriftprogrammen.
Wenn eine eingebettete Schriftart verwendet wird, um Text in Formularfeldern auszufüllen, muss die gesamte Schriftart eingebettet werden, da der Ersteller im Voraus nicht weiß, welche Zeichen letztendlich vom Benutzer ausgewählt werden. Aus technischer Sicht bleibt der Text bearbeitbar, wenn die zugehörige Schriftart nicht subsettiert ist, und umgekehrt. Aber es gibt auch rechtliche Einschränkungen.
Das Einbetten und auch das Subsetting einer Schriftart unterliegt der Lizenzierung des Schriftartenherstellers. Die Mehrheit der Lizenzen räumt das Recht ein, die Schriftart zum Reproduzieren, z. B. zum Anzeigen und Drucken, frei zu verwenden, schränkt jedoch die Erstellung und Bearbeitung von Text auf den Lizenzinhaber ein. In jedem Fall sollten Sie die Lizenzbedingungen sorgfältig überprüfen, bevor Sie eine Schriftart verwenden, um rechtliche Probleme zu vermeiden.
TrueType- und OpenType-Schriftarten enthalten Informationen zu den Nutzungsrechten, die der Erstellersoftware mitteilen, ob eine Schriftart eingebettet werden darf oder nicht. Einige Ersteller befolgen diese Flags, andere nicht. Was auch immer diese Informationen Ihnen sagen, kann nur als Hinweis betrachtet werden. Am Ende ist der schriftliche Lizenztext, der mit der gekauften Schriftart geliefert wird, die einzige entscheidende Informationsquelle.
PDF-zu-PDF/A-Konversion
Eine PDF-zu-PDF/A-Konvertersoftware muss Schriftarten einbetten, wenn diese nicht vorhanden sind. Für ein wohlgeformtes PDF-Eingabedokument ist dies kein Problem. Wenn die Schriftart (nach Name) in der installierten Schriftartenbibliothek des Betriebssystems gefunden wird, wird sie verwendet. Wenn sie nicht gefunden wird, wird sie durch eine Schriftart ersetzt, die ähnliche Eigenschaften wie die gesuchte Schriftart hat. Solche Schriftarten werden oft erstellt, indem ein allgemeines Schriftarttemplate für Serif und Nicht-Serif-Zeichen (Multiple Master Fonts) verwendet wird, anstatt installierte Schriftarten.
Wenn das PDF-Eingabedokument nicht wohlgeformt ist (z. B. wenn nicht eingebettete Schriftarten existieren, die symbolisch oder CID-Schriftarten ohne bekanntes CMAP usw. sind), muss der Konverter ähnliche Heuristiken verwenden, wie sie ein Viewer in einer solchen Situation verwenden würde. Aber da diese Algorithmen nicht narrensicher sind, könnte das Ergebnis möglicherweise nicht wie erwartet aussehen oder die Konversion könnte sogar fehlschlagen.
PDF/A-Betrachter
Ein Betrachter (im Allgemeinen eine Software, die PDF-Dateien liest) kann sich unterschiedlich verhalten, abhängig davon, ob das Dokument behauptet, dem PDF/A-Standard zu entsprechen oder nicht. Wenn das Dokument das PDF/A-Label trägt, ist der Betrachter verpflichtet, die eingebetteten Schriftarten zu verwenden, während er für ein reguläres PDF-Dokument stattdessen die installierten Schriftarten verwenden kann. Die Verwendung einer installierten Schriftart ist in der Regel schneller, als die eingebettete Schriftart aus ihrem kompakten und möglicherweise verschlüsselten Datenstrom zu laden. Andererseits, selbst wenn Schriftarten denselben Namen haben, können sie unterschiedlich aussehen und sich anders verhalten.