Private Use Area

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

In Unicode sind spezielle Bereiche als Private Use Areas (PUA, engl. für „Unicodebereiche für den eigenen Gebrauch“) ausgewiesen. Den Codepunkten in diesen Bereichen werden niemals in Unicode selbst standardisierte Zeichen zugewiesen. Somit können diese für privat definierte Zeichen verwendet werden, die zwischen den Erzeugern und Verwendern der Texte, die sie enthalten, individuell abgesprochen sein müssen. Solche Vereinbarungen können z. B. in dem gemeinsamen Verwenden einer Schriftartdatei bestehen, in denen solche Zeichen zur Verwendung bereitgestellt werden.

Codebereiche[Bearbeiten]

Der Unicode-Standard weist die im Folgenden beschriebenen drei Bereiche als für den eigenen Gebrauch der Nutzer bestimmt aus.

Private Use Zone[Bearbeiten]

Die Private Use Zone[1] liegt in der Ebene 0 (BMP, Basic Multilingual Plane) und umfasst den Bereich von U+E000 bis U+F8FF. Das sind 6400 Codepunkte.

Welche Zeichen eine Schriftart in der Private Use Zone definiert hat, kann mit der Vorlage:Private-Use-Zone-Test ermittelt werden.

Private Use Planes[Bearbeiten]

Die Unicode-Ebenen 15 und 16 enthalten nur die beiden Blöcke Supplementary Private Use Area-A bzw. -B. Anstatt von PUA-A und PUA-B ist daher teilweise auch zusammenfassend von Private Use Planes[2] (PUP) die Rede.

Supplementary Private Use Area-A[Bearbeiten]

Die Supplementary Private Use Area-A umfasst die komplette Ebene 15, also den Bereich von U+F0000 bis U+FFFFD. Das sind 65534 Codepunkte.

Welche Zeichen eine Schriftart in der Supplementary Private Use Area-A definiert hat, kann mit der Vorlage:Supplementary-Private-Use-Area-A-Test ermittelt werden.

Supplementary Private Use Area-B[Bearbeiten]

Die Supplementary Private Use Area-B umfasst die komplette Ebene 16, also den Bereich von U+100000 bis U+10FFFD. Das sind 65534 Codepunkte.

Welche Zeichen eine Schriftart in der Supplementary Private Use Area-B definiert hat, kann mit der Vorlage:Supplementary-Private-Use-Area-B-Test ermittelt werden.

Verwendung[Bearbeiten]

Die Zuordnung von Zeichen zu Codepoints wird in diesen Bereichen nicht vom Unicode-Konsortium reglementiert. Es existieren jedoch verschiedene Organisationen und Initiativen, die die Vergabe von Zeichencodes in diesen Bereichen koordinieren.

Medieval Unicode Font Initiative[Bearbeiten]

Die Medieval Unicode Font Initiative (MUFI)[3] koordiniert die Kodierung historischer Zeichen, Zeichenvarianten und Ligaturen und vergibt dafür Codepoints aus der Private Use Zone, vorwiegend aus dem Bereich U+E000 bis U+EFFF.

Verwendung unter Linux[Bearbeiten]

Unter Linux wurde die Private Use Zone in 2 Bereiche geteilt[4]:

  • U+E000 … U+EFFF : „End User Zone“
  • U+F000 … U+F8FF : „Linux Zone“

Die End User Zone steht für den Endanwender frei zur Verfügung. Die Linux Zone wird für betriebssysteminterne Zwecke reserviert. Dabei wird der Bereich von U+F000 bis U+F7FF genutzt, um ein 1:1-Mapping der verwendeten Bildschirmschriftart abzudecken. Das ermöglicht Programmen wie consolechars alle Zeichen der gerade verwendeten Bildschirmschriftart darzustellen. Da Linux maximal 512 Zeichen in einer Bildschirmschriftart unterstützt, ist dieser Bereich mehr als ausreichend. Der Bereich von U+F800 bis U+F8FF wird für Zeichen benutzt, die unter Linux benötigt oder gewünscht werden, die jedoch (noch) nicht im Unicode-Zeichensatz enthalten sind.

Codepoint Zeichen Bemerkung
U+F800 DEC VT GRAPHICS HORIZONTAL LINE SCAN 1 mit Aufnahme dieser Zeichen in Unicode 3.2 sind diese 4 Codepositionen veraltet („deprecated“).
U+F801 DEC VT GRAPHICS HORIZONTAL LINE SCAN 3
U+F803 DEC VT GRAPHICS HORIZONTAL LINE SCAN 7
U+F804 DEC VT GRAPHICS HORIZONTAL LINE SCAN 9
U+F810 KEYBOARD SYMBOL FLYING FLAG Tastensymbol „wehende Flagge“ Windows 3 logo simplified.svg = Windowstaste
U+F811 KEYBOARD SYMBOL PULLDOWN MENU Tastensymbol Menü
U+F812 KEYBOARD SYMBOL OPEN APPLE Tastensymbol „leerer ApfelApple logo hollow.svg
U+F813 KEYBOARD SYMBOL SOLID APPLE Tastensymbol „ausgefüllter Apfel“ Apple logo black.svg
U+F8D0 Buchstaben und Zahlzeichen der fiktionalen Klingonischen Sprache
U+F8FF

Die Vergabe der Codepunkte in der „Linux Zone“ wird von der Linux Assigned Names and Numbers Authority (LANANA) koordiniert.

ConScript Unicode Registry[Bearbeiten]

Dieses Freiwilligenprojekt[5] koordiniert die Aufnahme fiktionaler Schriften, die in Romanen oder Filmen verwendet werden, wie den Sprachen aus der Mittelerde-Fantasiewelt von J. R. R. Tolkien. Sie vergibt Codepoints in allen 3 privaten Unicodeblöcken und koordiniert sich dabei mit der LANANA, nicht jedoch mit der MUFI.

Weitere Verwendungen[Bearbeiten]

Siehe auch[Bearbeiten]

Andreas Stötzner: LINCUA – Ein Unicode-PUA-Harmonisierungsplan. 20. Juni 2012, abgerufen am 26. August 2012.

Einzelnachweise[Bearbeiten]

  1. Michael Everson et. al.: Roadmap to the BMP – revision 6.1.0. The Unicode Consortium, 1. Februar 2012, abgerufen am 26. August 2012 (Der Begriff “Private Use Zone” wird im Text des Unicode-Standards nicht verwendet, er findet sich aber auf dieser vom Unicode-Komitee offiziell bereitgestellten Internetseite.).
  2. Unicode 6.3 Kapitel 2.8, Seite 34, erster Absatz (da die Core-Spezifikation für Version 6.3 nicht verändert und auch nicht neu veröffentlicht wurde, gelten die Dateien von Version 6.2 für 6.3 unverändert weiter.)
  3. Medieval Unicode Font Initiative. Abgerufen am 21. August 2012.
  4. H. Peter Anvin (ed.): Linux Zone Unicode Assignments. The "Linux Assigned Names And Numbers Authority" (LANANA) project, 17. Januar 2005, abgerufen am 12. September 2012 (TXT, englisch).
  5. ConScript Unicode Registry. Abgerufen am 21. August 2012.
  6. Peter Constable and Lorna A. Priest: SIL Corporate PUA Assignments. 17. April 2012, abgerufen am 21. August 2012.
  7. Chris Harvey: Languagegeek Fonts. 29. Juni 2012, abgerufen am 21. August 2012.