Handhabung von eingebetteten und nicht eingebetteten Schriftarten in PDF- und PDF/A-Dokumenten
Obwohl der erste Teil des PDF/A-Standards 2005 veröffentlicht wurde, besteht weiterhin Bedarf an einigen Klarstellungen bezüglich Schriftarten und Einbettung. Was verlangt der Standard genau? Wie sollten PDF zu PDF/A-Konverter Schriftarten handhaben? Wie gehen Betrachter tatsächlich damit um und wie sollten sie es tun?
PDF/A-Erstellung
Lass uns mit dem einfachsten Fall beginnen. Wenn Sie ein PDF/A-Dokument erstellen, müssen Sie im Allgemeinen alle verwendeten Schriftarten einbetten. Dies gilt für jede Variante von PDF/A, z. B. PDF/A-1b oder PDF/A-3u usw. Es gibt nur eine Ausnahme davon. Wenn der Text nicht sichtbar ist (Textdarstellungsmodus 3), ist das Einbetten nicht erforderlich. Unsichtbarer Text wird oft verwendet, um eine gescannte Seite mit dem Text eines OCR-Engines zu überlagern, um die Durchsuchbarkeit in einem gescannten Dokument zu ermöglichen, als wäre es ein digital erstelltes Dokument.
Wenn das Einbetten erforderlich ist, kann die Schriftart jedoch minimiert werden, sodass sie nur die Zeichen enthält, die im Dokument verwendet werden. Wenn ein Dokument z. B. den einzelnen Textstring "Hilfe" in Arial anzeigt, kann das eingebettete Arial-Schriftprogramm auf nur vier Zeichen reduziert werden. Dieser Prozess wird als Subsetting bezeichnet und wird umfassend verwendet, um die Größe der erstellten Datei zu reduzieren.
Aber die Ersteller müssen auf einige Zeichen achten, die aus anderen Zeichen bestehen, wie z. B. das deutsche Zeichen "ä", das aus dem Zeichen "a" und "¨" zusammengesetzt werden kann. Dies ist eine der Ursachen für schlechte PDFs mit unvollständigen Schriftprogrammen.
Wenn eine eingebettete Schriftart verwendet wird, um Text in Formularfeldern auszufüllen, muss die gesamte Schriftart eingebettet werden, da der Ersteller im Voraus nicht weiß, welche Zeichen der Benutzer letztendlich auswählt. Aus technischer Sicht bleibt der Text editierbar, wenn die zugehörige Schriftart nicht unterteilt ist und umgekehrt. Aber es gibt auch rechtliche Einschränkungen.
Das Einbetten und auch das Subsetting einer Schriftart unterliegt der Lizenzierung des Schriftartenherstellers. Die Mehrheit der Lizenzen gewährt das Recht, die Schriftart frei für die Reproduktion wie die Anzeige und das Drucken zu verwenden, schränkt jedoch die Erstellung und Bearbeitung von Text auf den Lizenzinhaber ein. In jedem Fall sollten Sie die Lizenzbedingungen sorgfältig überprüfen, bevor Sie eine Schriftart verwenden, um rechtliche Probleme zu vermeiden.
TrueType- und OpenType-Schriftarten enthalten Informationen zu den Nutzungsrechten, die der Erstellungssoftware mitteilen, ob eine Schriftart eingebettet werden darf oder nicht. Einige Ersteller befolgen diese Hinweise, andere nicht. Was auch immer diese Informationen Ihnen sagen, sie können nur als Hinweis betrachtet werden. Letztendlich ist der schriftliche Lizenztext, der mit der gekauften Schriftart geliefert wird, die einzige entscheidende Informationsquelle.
PDF zu PDF/A-Konvertierung
Eine PDF zu PDF/A-Konverter-Software muss Schriftarten einbetten, wenn sie es nicht sind. Für ein gut formatiertes PDF-Eingabedokument ist dies kein Problem. Wenn die Schriftart (nach Namen) in der installierten Schriftartensammlung des Betriebssystems gefunden wird, wird sie verwendet. Wenn sie nicht gefunden wird, wird sie durch eine Schriftart ersetzt, die ähnliche Eigenschaften wie die gesuchte Schriftart hat. Solche Schriftarten werden oft unter Verwendung einer generischen Schriftartvorlage für Serif- und Nicht-Serif-Zeichen (Multiple Master Fonts) anstelle installierter Schriftarten synthetisiert.
Wenn das PDF-Eingabedokument nicht gut formatiert ist (z. B. wenn nicht eingebettete Schriftarten vorhanden sind, die symbolisch oder CID-Schriftarten ohne bekannten CMAP usw. sind), muss der Konverter ähnliche Heuristiken verwenden wie ein Viewer in einer solchen Situation. Aber da diese Algorithmen nicht narrensicher sind, könnte das Ergebnis nicht wie erwartet aussehen oder die Konvertierung könnte sogar fehlschlagen.
PDF/A-Viewer
Ein Viewer (in der Regel eine Software, die PDF-Dateien liest) kann sich unterschiedlich verhalten, abhängig davon, ob das Dokument angibt, dass es dem PDF/A-Standard entspricht oder nicht. Wenn das Dokument das PDF/A-Label trägt, muss der Viewer die eingebetteten Schriftarten verwenden, während er für ein reguläres PDF-Dokument stattdessen die installierten Schriftarten verwenden kann. Die Verwendung einer installierten Schriftart ist in der Regel schneller als das Laden der eingebetteten Schriftart aus ihrem komprimierten und möglicherweise verschlüsselten Datenstrom. Auf der anderen Seite, selbst wenn Schriften denselben Namen haben, können sie unterschiedlich aussehen und sich unterschiedlich verhalten.