Portal:Unicode/Übereinkünfte

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Aufgaben des Portals sind der Inhalt der Kategorie:Unicode, einzelne Buchstabenartikel im Kategoriebaum der Kategorie:Schriftzeichen und in geringerem Maße auch Alphabetartikel. Ein langfristiges Ziel ist die systematische Erarbeitung von Vorschlägen für deutsche Namen für alle Unicode-Symbole.

Bitte hier mit # ~~~ eintragen, wer interessiert ist, in diesem WikiProjekt mitzuarbeiten.

  1. Prince Kassad (als Ersteller)
  2. Reiner Stoppok (als Pionier)
  3. Daniel Bunčić
  4. Gismatis
  5. jpp
  6. Cäsium137 (D.)
  7. Simplicius
  8. Morty 17:32, 18. Apr. 2008 (CEST)[Beantworten]
  9. Rainer Seitel 02:49, 21. Jun. 2008 (CEST)[Beantworten]
  • Erstellung von Buchstabenartikeln aller Buchstaben im Repertoire des ISO 8859-1-Zeichensatzes erledigtErledigt
  • Verbesserung der bestehenden Buchstabenartikel, mit Augenmerk auf die Sorgenkinder in der Kategorie:Kyrillischer Buchstabe
  • Erweiterung der Liste der Unicode-Zeichen
  • Beschreibungen zu den Unicode-Blöcken
  • Sichtung des vorhandenen deutschsprachigen Materials zur Benennung der Symbole sowie Erarbeitung von Vorschlägen für deutsche Bezeichnungen für alle Unicode-Symbole (in Anlehnung an das engl. Original).
  • Lemmatauglichkeit der deutschen Übersetzungen.
  • Deutsche Bezeichnungen für Unicode-Symbole und zwar ausschließlich mit lateinischen Buchstaben ohne Sonderzeichen geschrieben

Fehlende Artikel[Quelltext bearbeiten]

edit

Livisches Alphabet - Doppelgravis (en) - (ko) - Stabziffern (en) - Dz (en) - (th)

Hinweise zur Artikelerstellung[Quelltext bearbeiten]

Die in diesem WikiProjekt vewendete Unicode-Tabelle (auf englisch) befindet sich unter unicode.org.

Für noch nicht existierende Artikel zu Unicode-Blöcken (sowie zur Ergänzung von Zeichen zu bereits existierenden Artikeln) lassen sich die Tabellen und die Standard-Texte sehr einfach mit einem Online-Generator erzeugen (ausführlicherer Kommentar).

Buchstabenartikel[Quelltext bearbeiten]

  • Als Lemma für Buchstabenartikel das Zeichen selbst nehmen.
  • Bei Buchstabenartikeln zu lateinischen Zeichen ist als Basis der Artikel Û in dieser Revision zu verwenden.
  • Bei Buchstaben, die in Unicode 4.1, 5.0 oder in 5.1 hinzugefügt wurden, sollte auf den Vorschlag (engl. proposal) verlinkt werden (Google-Suche nach der Bezeichnung, mit Seitenbegrenzung auf std.dkuug.dk).
  • Mehrere Buchstaben für dieselbe Sprache sollten, falls sie in keiner weiteren Sprache benutzt werden, in einen Sammelartikel zum Alphabet zusammengefasst werden.
  • Der Präfix für Unicode-Codepunkte ist U+, für alle anderen Zeichensätze lautet er 0x.
  • Man kann lateinische Buchstabenartikel von der chinesischen Wikipedia übersetzen, da dort recht viele bereits vorhanden sind. Die englische Wikipedia kann auch als Übersetzungsbasis dienen, die Informationen dort sind aber mit Vorsicht zu genießen.

Übersetzungsvereinbarungen[Quelltext bearbeiten]

Folgende Wörterliste enthält Wörter der englischen Originalbezeichnungen der Zeichen, für die sich nebenstehende Übersetzung als Konsens herausgebildet hat. Um eine gewisse Einheitlichkeit zu gewährleisten, sollte stets der angegebene deutsche Ausdruck verwendet werden.

  • bar Je nach Lage: Querstrich, Schrägstrich, senkrechter Strich (wie stroke)
  • above übergesetzt (z. B. "mit übergesetzter Tilde")
  • below untergesetzt (z. B. "mit untergesetztem Komma")
  • caron Hatschek
  • diaeresis Trema
  • turned gedreht
  • stroke Je nach Lage: Querstrich, Schrägstrich, senkrechter Strich (wie bar)

Weitere Hinweise[Quelltext bearbeiten]

  • Die Zeichentabelle von Microsoft zum Beispiel von Arial Unicode MS sollte möglichst nicht oder nur sehr kritisch als Basis für Buchstabenbezeichnungen verwendet werden, da die dortigen Bezeichnungen unüblich oder teilweise falsch sind. Weiterhin ist die Zeichentabelle nicht immer auf dem neuesten Stand, weswegen eine alternative Zeichentabelle aus dem Internet empfohlen ist.

Bitte welche alternative Zeichentabelle? Die unten notierten charsets müssen/können wohl bei SimSun (ein wohl erheblich vollständiger"er" Font als MS Arial Unicode für CJK) nicht übereinstimmen. Dumme(?) Frage: wie bekommt die charsets eines Fonts heraus? Für Arial Unicode von Microsoft habe ich diese Tabelle (gefunden wohl in der MS-rtf-Dokumentation):

   // 0 - ANSI
   // 1 - Default
   // 2 - Symbol
   // 3 - Invalid
   // 77 - Mac
   // 128 - Shift Jis
   // 129 - Hangul
   // 130 - Johab
   // 134 - GB2312        steht das fuer GB18030?
   // 136 - Big5
   // 161 - Greek
   // 162 - Turkish
   // 163 - Vietnamese
   // 177 - Hebrew
   // 178 - Arabic
   // 179 - Arabic Traditional
   // 180 - Arabic user
   // 181 - Hebrew user
   // 186 - Baltic
   // 204 - Russian
   // 222 - Thai
   // 238 - Eastern European (gemeint ist Mitteleuropa)
   // 254 - PC 437
   // 255 - OEM

[derzeit noch ohne wikipedia-benutzernamen,sorry.] Gruß Klaus