PDF/A

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

PDF/A ist ein Format zur Langzeitarchivierung digitaler Dokumente, das von der International Organization for Standardization (ISO) als Subset des Portable Document Format (PDF) genormt wurde. Die Norm legt fest, wie die Elemente der zugrundeliegenden PDF-Versionen im Hinblick auf die Langzeitarchivierung verwendet werden müssen. Dabei gibt es sowohl zwingend vorgeschriebene als auch nicht zugelassene Bestandteile.

PDF/A-1[Bearbeiten]

Die Norm wurde 2005 als ISO 19005-1:2005, Document management — Electronic document file format for long-term preservation — Part 1: Use of PDF 1.4 (PDF/A-1) veröffentlicht[1] und spezifiziert zwei Konformitätsebenen:

  • PDF/A-1b – Level B (Basic) conformance: eindeutige visuelle Reproduzierbarkeit
  • PDF/A-1a – Level A (Accessible) conformance: sowohl eindeutige visuelle Reproduzierbarkeit als auch Abbildbarkeit von Text nach Unicode und inhaltliche Strukturierung des Dokuments, so dass es im Sinne der Barrierefreiheit von einem Screenreader vorgelesen werden kann.
  • PDF/A-1 basiert auf PDF 1.4.
  • Eigenschaften von PDF/A-1b:
    • Nicht erlaubt sind Referenzen auf Ressourcen, die nicht in der Datei selbst enthalten sind, das heißt insbesondere, dass alle verwendeten Bilder und Schriften (die Begrenzung auf die verwendeten Zeichen ist erlaubt) in der Datei enthalten sein müssen.
    • Farben müssen ausreichend definiert sein, um eine eindeutige Farbdarstellung zu gewährleisten. Hier kommen entweder Quellprofile oder ein „Output Intent“ (Beschreibung der typischen Art der Ausgabe mittels eines ICC-Profils, wie beispielsweise sRGB für bildschirmorientierte Dokumente) zur Anwendung.
    • Transparente Elemente sind nicht erlaubt.
    • Die Verwendung von JavaScript oder von Aktionen sind nicht zugelassen, da ihre Ausführung den Inhalt oder die Darstellung des PDFs verändern oder beeinflussen könnten. Audio- oder Videodaten dürfen nicht eingebettet sein.
    • Verschlüsselungen und damit auch teilweises Sperren von Funktionen der Datei wie Drucken und Daten herauskopieren sind untersagt.
    • Die Verwendung von patentrechtlich geschützten Komponenten, insbesondere die Komprimierung mittels Lempel-Ziv-Welch-Algorithmus (LZW) ist untersagt. Obgleich davon auszugehen ist, dass der LZW-Kompressionsalgorithmus inzwischen mit keinem Patent mehr belastet ist, wurde durch die ISO dennoch sicherheitshalber die Verwendung von LZW ausgeschlossen – nicht zuletzt da mit ZIP eine ebenbürtige Kompression zur Verfügung steht, die frei von Patenten ist.
    • Die Einbettung von digitalen Signaturen wird unterstützt.
    • Die Datei muss in den Metadaten im Extensible Metadata Platform-Format (XMP) als PDF/A-1-konform gekennzeichnet sein.
    • Wenn weitere Metadaten eingefügt werden, so muss dies auch im XMP-Format als XMP-Erweiterungsschema erfolgen.
  • Eigenschaften von PDF/A-1a, zusätzlich zu den Eigenschaften von PDF/A-1b:
    • Sämtlicher Text muss nach Unicode abgebildet werden können.
    • Die inhaltliche Struktur der PDF/A-Datei muss mittels tagged PDF angegeben sein.

PDF/A-2[Bearbeiten]

Die Norm wurde am 20. Juni 2011 als ISO 19005-2:2011, Document management – Electronic document file format for long-term preservation – Part 2: Use of ISO 32000-1 (PDF/A-2) veröffentlicht und definiert drei Konformitätsebenen[2]:

  • PDF/A-2a: realisiert vollständig alle Anforderungen der ISO 19005-2, insbesondere alle strukturellen und semantischen Eigenschaften.
  • PDF/A-2b: Mindestanforderung an eine PDF/A-2 Datei, garantiert das richtige Erscheinungsbild des Dokuments für eine Langzeitarchivierung.
  • PDF/A-2u: wie 2b, plus: der gesamte Text ist in Unicode abgebildet, so dass der gesamte Text indexiert und dargestellt werden kann.[3]
  • wesentliche Erweiterungen gegenüber PDF/A-1:
    • basiert auf PDF 1.7 (ISO 32000-1)
    • JPEG 2000 Kompression erlaubt[4]
    • Transparente Elemente sind erlaubt
    • Ebenen erlaubt
    • OpenType-Fonts können eingebettet werden
    • digitale Signaturen in Übereinstimmung mit den PAdES (PDF Advanced Electronic Signatures, ETSI TS 102 778)
    • Container: PDF/A-1 Dateien können in PDF/A-2 Dateien eingebettet werden

PDF/A-3[Bearbeiten]

Die Spezifikation von PDF/A-3 wurde am 17. Oktober 2012 veröffentlicht.[5] Eine wesentliche Erweiterung gegenüber PDF/A-2 stellen die Container dar: beliebige Dateitypen können in PDF/A-3 eingebettet werden.[6] Einem PDF/A-3-Dokument können auf diesem Wege zum Beispiel die Ursprungsdaten beigefügt werden, mit denen sie erstellt wurde. Der Standard regelt die Archivtauglichkeit der eingebetteten Dateien, die nicht selbst PDF/A-konform sind, nicht.

PDF/A-3 eröffnet Möglichkeiten für Elektronische Rechnungen, da mit diesem Standard in einer Datei sowohl die maschinenlesbaren Daten im XML-Format hinterlegt werden können als auch die archivtaugliche PDF-Ausgabe der Rechnung. Im Juni 2014 wurde der ZUGFeRD-Standard veröffentlicht, der auf PDF/A-3 aufsetzt.[7]

Gültigkeit[Bearbeiten]

PDF/A-1 bleibt weiterhin in Kraft. PDF/A-1-konforme Dateien genügen auch den Anforderungen des entsprechenden PDF/A-2-Konformitätslevels. Wo PDF/A-1-Funktionen ausreichen, besteht kein zwingender Grund, auf PDF/A-2 zu wechseln.

Überprüfung[Bearbeiten]

Eine Validierung von gültigem PDF/A ist über entsprechende Prüfwerkzeuge möglich (siehe Weblinks).

Siehe auch[Bearbeiten]

Literatur[Bearbeiten]

  • ISO 19005-1:2005 – Document management – Electronic document file format for long-term preservation – Part 1: Use of PDF 1.4 (PDF/A-1), Norm im Iso-Store
  • ISO 19005-2:2011 – Document management – Electronic document file format for long-term preservation – Part 2: Use of ISO 32000-1 (PDF/A-2), Norm im Iso-Store
  • PDF/A kompakt – Digitale Langzeitarchivierung mit PDF (ISBN 978-3-9811648-0-0)

Weblinks[Bearbeiten]

Einzelnachweise[Bearbeiten]

  1. ISO News: New ISO standard will ensure long life for PDF documents
  2. DIN Normenausschuss Bibliotheks- und Dokumentationswesen, NABD
  3. Sustainability of Digital Formats – Planning for Library of Congress Collections
  4. Sustainability of Digital Formats – Planning for Library of Congress Collections
  5. pdfa.org: ISO hat PDF/A-3 veröffentlicht
  6. pdfa.org: PDF/A inklusive der Normteile 1 bis 3
  7. Computerwoche online: Elektronische Rechnung auf dem Vormarsch