Portal Diskussion:Unicode/Archiv/2007

aus Wikipedia, der freien Enzyklopädie
Letzter Kommentar: vor 15 Jahren von Simplicius in Abschnitt Kummerkasten
Zur Navigation springen Zur Suche springen

Wie lang soll die Liste werden?

Es sind inzwischen ja schon einige zehntausend Zeichen im Unicode definiert, sollen die alle in dieser Tabelle auftauchen? Wo soll das hinführen? Ich wäre für eine sinnvolle Gruppierung (am besten die Gruppierung vom Unicode-Konsortium übernehmen?) und dann Sammelartikel. --RokerHRO 10:25, 7. Jun. 2007 (CEST)

Ich würde ebenfalls nach Unicode-Blöcken gruppieren, aber große Blöcke (CJK-Ideographen mitsamt Erweiterung A und B sowie Zusatz, Hangul, Yi, etc.) in eigene Artikel verfrachten, und den Rest in einen Sammelartikel. -- Prince Kassad 19:54, 7. Jun. 2007 (CEST)
Genau so verfährt ja auch der englische Artikel, an dem wir uns orientieren können. Gismatis 23:41, 7. Jun. 2007 (CEST)
So ist es. --Reiner Stoppok 03:27, 9. Jun. 2007 (CEST) (Viel Vergnügen beim Übersetzen und beim Anlegen von Redirects ...)
also abgesehen vom prinzipellen sinn: über die Blöcke ist sie absolut redundant zu Liste der Unicode-Blöcke +deren verweise auf unterartikel, einen sinn macht sie imho nur, wenn sie ein TOC hat, in dem ich nach U+ABCD suchen kann..
aber reden wir lieber über den allgemeinen sinn: nicht umsonst steht im vorbild ein {merge} mit en:Mapping of Unicode characters - das wohl das pendant zu unserer Liste der Unicode-Blöcke mit ein "paar" einführenden worten ist.. ich kann mir die liste "fertig" irgendwie nicht richtig vorstellen, ich fürchte, das ist nicht die technologie der wahl für solche datenstrukturen in dieser menge.. -- W!B: 17:49, 16. Jun. 2007 (CEST)
Think big! --Reiner Stoppok 00:58, 17. Jun. 2007 (CEST)
recht hast Du! ich hätt jedenfalls gern die liste mal von der community abgesegnet, bevor ich da arbeit reinsteck: wie wärs, wenn wir einvernehmlich einen LA setzen - dann herrscht wenigsten klarheit.. denken wir ans ganze.. -- W!B: 12:24, 17. Jun. 2007 (CEST)
Auf keinen Fall! Dann heißt es: "Die Liste ist ja eine reine Baustelle!" und "Was ist überhaupt so interessant an diesen vielen Zeichen?" und weg ist sie. Löschanträge sollten immer mit dem Ziel erfolgen, dass der Artikel gelöscht wird. Um einen Artikel absegnen zu lassen, sind Löschanträge nicht geeignet. Die Wikipedia wächst nur dadurch, dass jeder Autor das Risiko eines Löschantrags in Kauf nimmt. Gismatis 15:02, 17. Jun. 2007 (CEST)
überzeugend argumentiert - ich wanke ;) -- W!B: 12:36, 19. Jun. 2007 (CEST)

Nicht darstellbare Zeichen

Sollen nichtdarstellbare Zeichen wie Kontrollzeichen oder Diakritiken in die Liste? -- Prince Kassad 20:49, 15. Jun. 2007 (CEST)

Ja. Alles. Diakritische Zeichen zumindest sind darstellbar. --Reiner Stoppok 11:36, 16. Jun. 2007 (CEST)

Diakritische Zeichen erscheinen meist nur, wenn auch ein Buchstabe zum Kombinieren vorhanden ist. -- Prince Kassad 12:12, 16. Jun. 2007 (CEST)
noi, das unterscheidet die 02B0–02FF Spacing Modifier Letters und die paar aus Basic Latin von den 0300–036F Combining Diacritical Marks und den Extendend/Supplement/Additional-Blöcken - erstere stehen für sich alleine («^», «´», «˘»), zweitere kombinieren sich mit einem oder mehreren anderen glyphen, und bei dritteren ist das diakritikon in die glyphe integriert - es gibt die meisten jeweils spacing und combining und fix - die inzwischen schon legendäre möwe ist eine der wenigen, dies nur combing gibt, und zicken machen wird - da müssten wir mit einem spacer tricksen.. -- W!B: 17:23, 16. Jun. 2007 (CEST)
Richtig. Für die Darstellung in den Tabellen eignet sich ein Leerzeichen als Trägerzeichen. Meist wird dazu ein nichttrennendes Leerzeichen verwendet, aber das ist eigentlich gar nicht nötig. Gismatis 23:16, 16. Jun. 2007 (CEST)
Also ich musste vorhin irgendwo   statt ner Leerstelle schreiben, weil sich das Zeichen mit nur Leerstelle mit HTML-Tags kombiniert hätte.. --172.182.205.54 23:40, 16. Jun. 2007 (CEST)
Meinst du Wiki-Syntax? Habe vorhin nämlich festgestellt, dass ein Leerzeichen gar nicht funktionieren kann, weil das Wiki-Programm Leerzeichen nach einem Tabellenstrich ignoriert. Das mit dem Leerzeichen funktioniert nur innerhalb von Text. Aber auch das geschützte Leerzeichen bietet zumindest bei mir kein optimales Ergebnis. Das Zeichen befindet sich viel zu weit links. Gibt es vielleicht noch andere Lösungen? Gismatis 01:00, 17. Jun. 2007 (CEST)
aa͡
ii͡
  ͡
   ͡
keine chance, man muss nämlich bei jedem einzelnen diakritikon wissen wofürs gut ist (teil rücken sie 1 zeichen nach links zum vorigen, wie Gravis und so, teils aber ½, 1½ oder erstrecken sich über mehrere - solange wir nicht wissen, welches zeichen für was gut ist, bleibt der satz auch mit spacern reines herumgerate - also zerst mal kundig machen, was das zeichen tut.. vielleicht stehts ja so: hebräisch ͡כקּ -- W!B: 11:39, 17. Jun. 2007 (CEST)
  gehört nach dem Entwurf ISO/IEC 10646:2009 auch hin. Wobei nach meiner Erfahrung 2   sinnvoll sind, da auch einige kombinierende Zeichen breiter als ein Leerzeichen sind. -- Rainer Seitel

Lemma

Ich finde, das Lemma sollte Liste der Unicode-Zeichen heißen. Das klingt besser. Einwände? Gismatis 18:58, 16. Jun. 2007 (CEST)

Macht Sinn, allerdings erst, wenn die Liste auch vollständig ist. -- Prince Kassad 19:20, 16. Jun. 2007 (CEST)
Ich dachte nur, es sei besser, die Verschiebung vorzunehmen, solange der Artikel noch jung und dementsprechend wenig verlinkt ist. Später müssen Verweise angepasst werden. Ich finde es kein Problem, wenn der Artikel noch nicht fertig ist. Aber dann warten wir halt. Gismatis 23:13, 16. Jun. 2007 (CEST)
Kann mal bitte jemand den späteren Mehraufwand dafür bewerten?! Eigentlich ist es ja wirklich egal, ob es so oder so heisst. (Wir wollen aber auch niemanden enttäuschen, der erwartungsfroh draufklickt ... Keine Mogelpackungen bei Wikipedia!) --Reiner Stoppok 23:41, 16. Jun. 2007 (CEST)

Beschreibungen zu den Unicode-Blöcken?

Ich denke mir, wenn wir schon die Unicode-Blöcke mitsamt den enthaltenen Zeichen auflisten, sollten wir auch Beschreibungen zu den einzelnen Blöcken anlegen. Bei einem Teilblock einer Schrift (bsp. Lateinisch, erweitert zusätzlich) sollte dort stehen, in welcher Sprache diese Zeichen benutzt werden, bei Einzelblöcken für eine Schrift (bsp. Gujarati) eine Kurzbeschreibung mit Verweis auf den Hauptartikel (falls vorhanden). Alle Blöcke sollten zudem enthalten, seit wann sie in Unicode enthalten sind. Was haltet ihr von der Idee? -- Prince Kassad 22:58, 16. Jun. 2007 (CEST)

Die Idee ist gut. Man sollte auch für jeden Block einen "Blockwart" ernennen. --Reiner Stoppok 23:39, 16. Jun. 2007 (CEST)

Löschung von Lateinischer Buchstabe gestrecktes C (eigenes Lemma) und Lateinischer Buchstabe retroflexer Klick (Redirect auf Klick (Phonetik))

Leute, hier sind jede Menge Admins am werkeln, die systematisch deutsche Bezeichnungen kaputtmachen und die die Sache nicht im geringsten interessiert. Wie sollen wir denen mal den Unterschied zwischen "Wort" und "Begriff" klarmachen? --Reiner Stoppok 17:13, 5. Jul. 2007 (CEST)

Wenn auch in den Wiederherstellungswünschen abgelehnt wird, schätze ich wohl, dass wir auf ein eigenes Wiki umziehen müssen. -- Prince Kassad 18:17, 5. Jul. 2007 (CEST)

Eignung der Bezeichnungen für Lemmata/Redirects

Die Problematik wurde schon auf Wikipedia:Wiederherstellungswünsche#Lateinischer Buchstabe retroflexer Klick (erl., LA zurückgezogen) angesprochen, deshalb folgt hier eine Diskussion: Inwiefern sind die in diesem Artikel stehenden Bezeichnungen auch für Lemmata, bzw. Redirects zu gebrauchen?

Mein Vorschlag:

  • Bei Buchstaben ist generell das Lemma ohne Präfix "[Schriftsystem] (Groß/Klein)Buchstabe" anzulegen. Falls Buchstaben aus zwei Schriftsystemen den selben Namen tragen sollten, wird ein Klammerlemma verwendet [z. B. Alef (hebräischer Buchstabe)]
  • Bei lateinischen Ziffern und Satzzeichen wird das Lemma ebenfalls ohne Präfix angelegt, bei fremden Zahlensystemen/Satzzeichen ist ein Präfix in der Form "Arabische Null", "Chinesische Null", "Gujarati-Null" anzuhängen.
  • Bei Diakritiken wird, wie im ersten Punkt angegeben, kein Präfix verwendet. Ist das Diakritikum kombinierend, so ist das im Lemma anzugeben (z. B. "Kombinierendes Hatschek").
  • Bei Symbolen wird das Präfix ebenfalls weggelassen, außer, die Bezeichnung enthält keinen Präfix (z. B. "Anfang von Rub El Hizb", aber "Hochspannungssymbol")
  • Ungeklärt ist die Lage bei CJK-Zeichen, da diese von Unicode meist keine eindeutige Bezeichnung erhielten. Irgendwelche Vorschläge?

-- Prince Kassad 15:42, 11. Jul. 2007 (CEST)

Mein Vorschlag wäre eine Metaebene von deutschen Übersetzungen der englischen Unicode-Bezeichnungen (mit einer eigenen Kategorie: Unicode-Bezeichnung), von wo aus man dann in die Wikipedia-Konventionen abtauchen kann. So entgeht man allen Verwechslungsmöglichkeiten und schafft eine Ebene, auf der systematisch die Übersetzungen erfaßt werden können, die es schon gibt, oder die es noch zu prägen gilt. In Zweifelsfällen kann sich dort auch das eine oder andere englischsprachige Lemma befinden (wozu ich "Gestrecktes C" beispielsweise aber nicht rechnen würde). Sind die Microsoft-Namen (z.B. in der Zeichentabelle von Arial Unicode MS, oder wie das hiess) eigentlich frei zugänglich irgendwo? Die wären doch die beste Grundlage dafür. --Reiner Stoppok 17:37, 11. Jul. 2007 (CEST)

Zu den MS-Namen: Du kannst die getuname.dll von Windows disassemblieren, allerdings sind die Bezeichnungen auf Unicode 2.1 basiert und daher reichlich alt (und, wie in einer anderen Diskussion schon angemerkt, nicht immer ganz korrekt). -- Prince Kassad 18:04, 11. Jul. 2007 (CEST)
Ich kann Dich nicht verstehen. getuname.dll ? disassemblieren ? --Reiner Stoppok 02:35, 12. Jul. 2007 (CEST)
Musst du auch nicht, ist wirklich sehr technisch. Ich wollte nur darauf deuten, dass sich keiner die Mühe gemacht hat, sich die MS-Bezeichnungen zu holen und ins Internet zu stellen. -- Prince Kassad 09:46, 12. Jul. 2007 (CEST)

Diärese

Ich habe soeben Lateinisch 1, Ergänzung ergänzt und da taucht bei vielen Buchstaben bei den englischen Bezeichnungen "diaeresis" auf. Es ist mir klar, dass das eigentlich falsch ist, weil eine Diärese nicht das Zeichen meint, sondern die Art der Aussprache. Ich habe trotzdem "Diärese" genommen, weil ich gesehen habe, dass es bei Lateinisch erweitert-B bereits verwendet wird, und außerdem ist es nicht unser Problem, wenn das Unicode-Konsortium unkorrekte Bezeichnungen wählt. Einwände? Gismatis 02:28, 15. Jul. 2007 (CEST)

Wir können nur übersetzen, was das Unicode-Konsortium uns vorgibt, ganz egal, wie faktuell falsch das ist. Alles andere wäre Theoriefindung. -- Prince Kassad 15:39, 15. Jul. 2007 (CEST)
Es sollte gegebenenfalls dann in einem Lemma darauf hingewiesen werden, dass sich die deutsche Übersetzung unterscheidet. --Reiner Stoppok 16:45, 1. Aug. 2007 (CEST)
Die englische diaeresis heißt auf Deutsch Trema. --Daniel Bunčić 08:13, 24. Aug. 2007 (CEST)

Liste von Unicode-Zeichen/Vereinheitlichte CJK-Ideographen, Erweiterung B

Weil mich Gismatis so nett angesprochen hat, meine Anmerkung zunächst einmal hier: Ich bin zufällig über diesen "Artikel" gestolpert. Damit kann man überhaupt nichts anfangen. Es ist nichts erklärt, es gibt keine Hinweis sondern neben langen Ladezeiten nur eine Unmenge von "?". Die Sinnhaftigkeit des Artikels erschließt sich mir überhaupt nicht. So jedenfalls kann der imho hier nicht bleiben. --Pelz 21:54, 29. Jul. 2007 (CEST)

Ich habe angedacht, die Tabelle im Hauptartikel zu erstellen, aber dann würde sich die Ladezeit in die Minuten verlängern. Viel gibt es an den Zeichen auch nicht zu erklären, es sind vor allem chinesische Zeichen, die heute kaum noch in Benutzung sind, u. a. Zeichen für Chữ nôm. -- Prince Kassad 23:45, 29. Jul. 2007 (CEST) (Nachtrag: Steht jetzt auch so im Artikel.)
Da dürften meiner Meinung nach sogar noch mehr Datails stehen. Mich würde zum Beispiel interessieren, wie man die Zeichen für diesen Bereich überhaupt gesammelt hat, und wie sie angeordnet wurden. Hintergrundinformationen eben, wobei das dann eher ein eigener Artikel wäre. Das Hauptproblem ist aber, wie Benutzer:Pelz angesprochen hat, dass die meisten Benutzer keine Zeichen sehen werden, weil eine entsprechende Schriftart fehlt. Selbst mit der Code2002 sieht man längst nicht alle Zeichen. Für so spezielle Schriften wäre eine Lösung, wie es sie für die Hieroglyphen (Hilfe:Hieroglyphen) gibt, ideal. Was die lange Ladezeit betrifft, so frage ich mich, welchen Anteil die Server an diesem Problem haben und wieviel mein Computer. Was sollen wir also tun? Grundsätzlich finde ich, gehört in die Wikipeida eine vollständige Unicode-Zeichenliste. Gismatis 04:13, 30. Jul. 2007 (CEST)
Bei den Hieroglyphen ist der Unterschied, dass Hieroglyphen nicht im Unicode-Standard sind. Aber selbst wenn jemand so eine Erweiterung schreiben würde, die Ladezeiten wären riesig. Wenn wir mal mit 1 KB pro Zeichen rechnen, dann sind 1 x 42.711 = 42,7 MB (und da zählt die Tabellensyntax nicht dazu). Das können wir weder dem Leser noch den Servern antun. Wegen den Schriften wäre evtl. eine Liste von Schriften für jeden Unicode-Block nützlich (vielleicht als Erweiterung für Wikipedia:UTF-8-Probleme). -- Prince Kassad 10:47, 30. Jul. 2007 (CEST)
Grundsätzlich finde ich ebenfalls, dass in die Wikipedia eine vollständige Unicode-Zeichenliste gehört. Ich persönlich hielte auch das Prägen von deutschen Namen wie beispielsweise bei "Unicode Han Character 'ethics, morality, virtue' (U+5FB7)" langfristig für sinnvoll. --Reiner Stoppok 16:54, 1. Aug. 2007 (CEST) PS: Aber solange hier Redirects wie das von "Lateinischer Kleinbuchstabe L" neulich nach "l" als "Unfug" schnellgelöscht werden ...

Diverse Verdeutschungen und Verbesserungen

Gerade habe ich einen Haufen Verbesserungen (aus meiner Sicht) an der gesamten Seite vorgenommen. Da die Seite so riesig ist, dass sich da eigentlich niemand zurechtfinden kann, führe ich sie zusätzlich hier auf:

Ich hoffe, diese Änderungen waren im Sinne der Allgemeinheit; wenn nicht, bitte ich um Korrekturen bzw. Diskussionen. --Daniel Bunčić 20:40, 2. Sep. 2007 (CEST)

Den Mittelpunkt hab ich wieder eingefügt, und wegen dem Ezh bin ich nicht ganz einverstanden - Ezh ist nicht nur das Z mit Unterschlinge (bzw. laut Unicode ist es überhaupt nicht das Z mit Unterschlinge), sondern ein eigener Buchstabe mit eigener Bedeutung, der in einigen Sprachen verwendet wird. -- Prince Kassad 20:47, 2. Sep. 2007 (CEST)
Danke für die saubere Auflistung. Mit Diärese zu Trema bin ich einverstanden, da laut englischem Artikel diaresis im Englischen auch für das Zeichen stehen kann. Wäre es nicht so, müssten wir Diärese nehmen. Nicht einverstanden bin ich mit folgenden Änderungen:
  • O mit Strich => durchgestrichenes O (für Ø)
Die Originalbezeichnung lautet: O WITH STROKE. Wir sollten uns bei Umschreibungen eng an die Originalbezeichnung halten, daher lieber O mit Strich.
  • ... mit Ring oben, mit oberem Ring => mit Ring (6x)
  • ... mit Punkt oben, mit oberem Punkt => mit Punkt (8x)
Das Originalschema lautet: ... WITH RING/DOT ABOVE. Ich bin für das Schema mit Ring/Punkt oben. Wir dürfen das "above" nicht unterschlagen.
  • AE, Ae, ae => AE-Ligatur, ae-Ligatur (6x)
Das Originalschema lautet: LATIN CAPITAL/SMALL LETTER XY. Da steht nichts von ligature oder so. Deshalb sollte die Übersetzung auch ohne Zusatz sein. Also auch die vorherige Version mit Digraph war nicht korrekt. Eine offene Frage ist aber noch, wie wir es mit der Groß- und Kleinschreibung handhaben wollen.
  • Ezh => Z mit Unterschlinge (8x)
Sehe ich wie Prince Kassad. Das muss rückgängig gemacht werden.
  • dz, lj, nj usw. => "Digraph"
Das Originalschema lautet: LATIN CAPITAL/SMALL LETTER XY. Hierfür gilt dasselbe wie für AE.
  • Db Digraph, Qp Digraph, Dz als Digraph usw. => Db-Ligatur, Qp-Ligatur, Dz-Ligatur
Das Originalschema lautet: LATIN SMALL LETTER XY DIGRAPH. Hier ist also ein Zusatz geboten. Ich frage mich allerdings, ob wir uns nicht zu fest zum Fenster rauslehnen, wenn wir Ligatur nehmen, auch wenn die Zeichen tatsächlich Ligaturen sind. Ich finde wir sollten als Schema Lateinischer Kleinbuchstabe XY(xy)-Digraph nehmen. Was die Konstruktionen FENG, TESH usw. betrifft, bin ich unsicher. Sehen die nur zufälligerweise wie eigenständige Wörter aus, weil dabei die Bestandteile F und ENG, T und ESH einfach zusammengesetzt wurden wie bei den anderen Kombinationen, oder sollen das tatsächlich eigene Namen sein wie Eng und Esh? Als eigene Namen müssten wir Feng und Tesh schreiben ohne Bindestrich dazwischen. Ich nehme aber an, dass die Kombination nicht als Wort aufzufassen ist, und daher wäre diese Schreibweise falsch. Richtig wären dann entweder FEng und TEsh oder feng und tesh. Über den Bindestrich wäre zu diskutieren.
  • ... (Script) => Schreibschrift-... (ca. 10x)
  • ... (Blackletter) => Fraktur-... (ca. 5x)
Das Originalschema lautet: BLACK-LETTER/SCRIPT CAPITAL/SMALL X. Ich schlage daher als Schema vor: Fraktur/Schreibschrift großes/kleines X/(x).
  • Fleur de lys => Wappenlilie
Hier bin ich unsicher. Im Artikel Lilie (Heraldik) taucht dieser Ausdruck nicht auf, dafür heraldische Lilie als zweites Lemma. Fleur de lys wird zudem laut Artikel auch im Deutschen verwendet, daher im Zweifel für Fleur de lys. Was meinen die anderen?
Mit den restlichen Änderungen bin ich einverstanden. Gismatis 01:53, 3. Sep. 2007 (CEST)
Vielen Dank für Eure wohlwollenden Kommentare. Zu den kritisierten Änderungen reiche ich noch kurz Begründungen nach, vielleicht erledigt sich dann ja das eine oder andere wieder, und ansonsten dürfen natürlich auch Änderungen wieder zurückgenommen werden.
  • O mit Strich => durchgestrichenes O (für Ø)
Hier ist das Problem, dass stroke tatsächlich ein langer Strich zum Durchstreichen ist (verwandt mit dem Verb strike (through)), während unser Wort Strich genauso gut line oder dash heißen kann und deshalb nicht eindeutig ist. Die meisten unbedarften Wikipedia-Leser würden bei "o mit Strich" wohl eher an <ó> oder <ò> denken als an <ø>.
  • ... mit Ring oben, mit oberem Ring => mit Ring (6x)
  • ... mit Punkt oben, mit oberem Punkt => mit Punkt (8x)
Hieran stören mich zwei Dinge: Erstens ist "with ring above" stilistisch gutes Englisch, "mit Ring oben" aber ist Kindersprache - "mit einem Ring darüber" müsste es auf Hochdeutsch wenigstens heißen. Zweitens ist das "Original-Schema" hier völlig uneinheitlich: Bei einem Akut, Gravis oder Breve wird nie dazugesagt, dass die oben stehen, obwohl zumindest Breve auch unter dem Zeichen vorkommt. Auch der Ring und der Punkt stehen meistens oben und nur in einigen Transkriptionen unter dem Zeichen; es reicht doch, es dort zu sagen.
  • AE, Ae, ae => AE-Ligatur, ae-Ligatur (6x)
  • dz, lj, nj usw. => "Digraph"
  • Db Digraph, Qp Digraph, Dz als Digraph usw. => Db-Ligatur, Qp-Ligatur, Dz-Ligatur
Gut, hier hatte ich vor allem die "Digraph"-Angaben korrigiert, denn die sind schlicht falsch, ein Digraph sind zwei nebeneinander stehende Buchstaben, die zusammen ein Graphem ergeben, ohne dass dies graphisch irgendwie zu sehen ist, während eine Ligatur die graphische Vereinigung zweier Buchstaben ist, die überhaupt nicht ein Graphem sein müssen. Es wäre sehr wichtig, diesen Unterschied generell zu machen, denn es gibt ja beides, z.B. <dz> und <dž> als Digraphen und <ʣ> und <ʤ> als Ligaturen. Wenn die Erfinder der Unicode-Bezeichnungen den Unterschied nicht kannten, ist das deren Problem.
  • Ezh => Z mit Unterschlinge (8x)
Eigentlich wollte ich hier "altdeutsches Z" oder so etwas schreiben, habe dann im Artikel Z aber gesehen, dass das dort anders genannt wird. Warum sollen wir diesem Buchstaben nicht eine deutsche Bezeichnung geben, wenn es sie gibt? "Ezh" ist definitiv nicht deutsch, aber jeder Deutsche kennt die alte deutsche Variante des z mit der Unterschlinge.
  • ... (Script) => Schreibschrift-... (ca. 10x)
  • ... (Blackletter) => Fraktur-... (ca. 5x)
Wäre es denn zu viel Tribut an die deutsche Grammatik, wenn man stattdessen "großes Fraktur-F", "kleines Schreibschrift-l" usw. schreiben würde?
  • Fleur de lys => Wappenlilie
Meinetwegen können wir hier auch "heraldische Lilie" schreiben, aber "fleur de lys" bezeichnet, so der Wikipedia-Artikel Lilie (Heraldik), "diese heraldische Lilie mit speziellem Bezug zu Frankreich". Den speziellen Bezug zu Frankreich kann ich in der Unicode-Tabelle nicht erkennen.
--Daniel Bunčić 19:33, 3. Sep. 2007 (CEST)
  • O mit Strich => durchgestrichenes O (für Ø)
Wenn das so ist, bin ich mit durchgestrichenem O natürlich einverstanden! Obwohl, O mit Schrägstrich fände ich eigentlich eleganter, und vor allem würde Schrägstrich hervorragend zu Querstrich passen. Dann könnten wir stroke je nach Lage als "Schrägstrich" oder als "Querstrich" übersetzen. Dasselbe gälte dann für bar. Was meinst du?
  • ... mit Ring oben, mit oberem Ring => mit Ring (6x)
  • ... mit Punkt oben, mit oberem Punkt => mit Punkt (8x)
Die Bestandteile above und dementsprechend auch below waren von Anfang an eine Knacknuss. Eigentlich hänge ich überhaupt nicht an oben und unten, denn das ist stilistisch wirklich unschön. In der Ursprungsdiskussion haben Reiner Stoppok und ich so ziemlich alle Übersetzungsmöglichkeiten gesammelt. Am Schluss war ich irgendwie resigniert, weil keine Lösung wirklich optimal schien. Vorschlag: Lass es uns immer übersetzen, dann aber mit den wirklich korrekten deutschen Bezeichnungen übergesetzt und untergesetzt, also X mit übergesetztem Ring usw.
  • Digraph und Ligatur
Ich finde aber, dass es nicht unsere Aufgabe sein kann, Fehler des Unicode-Konsortiums zu korrigieren. Wir sollen ja nur berichten, und dazu gehört auch, dass wir falsche Bezeichnungen übernehmen. Wir könnten höchstens mit einer Fußnote auf diese Dinge hinweisen.
  • Ezh => Z mit Unterschlinge (8x)
So wie ich das sehe, handelt es sich beim Z mit Unterschlinge eben bloß um eine grafische Variante des Z, während das Ezh als besonderer Buchstabe gilt, der nur zufälligerweise (?) dieselbe Form hat wie das Z mit Unterschlinge. Im Zweifel für Ezh.
  • ... (Script) => Schreibschrift-... (ca. 10x)
  • ... (Blackletter) => Fraktur-... (ca. 5x)
In Ordnung. Ich habe das Originalschema so analysiert: SCRIPT: CAPITAL X. Aber wie ich jetzt merke, könnte es natürlich auch als SCRIPT- CAPITAL- X interpretiert werden und dann wäre im Deutschen natürlich eine Umstellung vorzunehmen. Im Englischen wird man aber auch nie schlau daraus, welches Wort welches modifiziert!
ich bin froh, dass du an diesem Artikel mithilfst. Wir können deine kompetente Hilfe gut gebrauchen! Hoffentlich kommt der Artikel durch! Gismatis 04:41, 5. Sep. 2007 (CEST)
Danke für Deine Bemerkungen und Argumente. Mit "O mit Schrägstrich" für <Ø> usw. bin ich völlig einverstanden, das ist eine gute Lösung. "Übergesetzt" und "untergesetzt" sind tolle Ideen! Bei Ligatur und Digraph bin ich nicht einverstanden. Okay, wenn im Original gar nichts steht, kann man es in der Übersetzung meinetwegen weglassen. Wenn aber im Original digraph steht und es ist in Wirklichkeit eine Ligatur, dann würde ich die Korrektur nicht in eine Fußnote verbannen, sondern eher so etwas wie "Ligatur [im Original: digraph]" schreiben.
Die graphische Ähnlichkeit zwischen dem altdeutschen z und dem "Ezh" der IPA ist ganz sicher kein Zufall, sondern hier wurde ebenso eine existierende graphische Variante funktional aufgeladen wie z.B. bei zweistöckigem <a> und einstöckigem (Schreibschrift-) <ɑ>, vor allem aber beim <ʃ>, das ja ursprünglich auch nur das lange S in der Kursivschrift ist (vgl. Bild:Long-s-US-Bill-of-Rights.jpg). Das ist sogar völlig parallel: die 'modernen' Formen <s> und <z> stehen für die dentalen/alveolaren Frikative (stimmlos und stimmhaft), die 'altdeutschen' Entsprechungen <ʃ> und <ʒ> für die entsprechenden palatoalveolaren Zischlaute. Der englische Wikipedia-Artikel Ezh (letter) informiert sogar darüber, dass diese Buchstabenvariante selbst auf Englisch alternativ auch als tailed z bezeichnet wird. Wenn das im Englischen Quasi-Synonyme sind, dann wird man doch, wenn es auf Deutsch für Ezh keine eigene Übersetzung gibt, auch tailed z übersetzen dürfen, oder? --Daniel Bunčić 12:30, 5. Sep. 2007 (CEST)
Hallo, ihr beiden! Es wäre schön, wenn man immer auf Anhieb und übersichtlich sortiert sehen könnte, wo in der Diskussion evtl. noch (geringfügige) Uneinigkeiten bestehen. Vielleicht könnte man das etwas übersichtlicher in einen extra Absatz packen. --Reiner Stoppok 21:37, 11. Sep. 2007 (CEST) PS: Dann muss derjenige, der sich hier nur ein bisschen mit herumstreiten will, nicht alles lesen. (Das "PS" sollte ein Witz sein ...)
Richtig. Übereinkünfte sollten immer in separaten Abschnitten festgehalten werden, was ich in den nächsten Tagen nachholen werde. Gismatis 04:01, 13. Sep. 2007 (CEST)
"heraldische Lilie" ist üblich, "fleur de lys" mit und ohne Bindestrich kommt in Büchern auch vor. Französich war die Sprache des Adels. Ebenso sind die Spielkartensymbole des französischen Blattes die heraldischen Symbole. (Wogegen das breite Herz aus den Dingbats eher in Kontaktanzeigen auftaucht.)
"Telefonaufzeichner" für U+2315 Anrufbeantworter ist einzigartig im WWW. :-)
U+232D heißt in der deutschen Norm nun mal Zylindrizität und nicht "Zylindrigkeit". usw. Ich habe für meine Seite nicht aus Langeweile ein paar Nächte hier in der Bibliothek verbracht.
U+2629 Kruckenkreuz darf nicht wörtlich von "cross of Jerusalem" übersetzt werden! Das kann man im Duden-Bildwörterbuch englisch/deutsch deutlich sehen. usw.
Schrägstrich und Querstrich zu unterscheiden halte ich für sinnvoll. -- Rainer Seitel

Technische Lösung des Längenproblems

Aufgrund der Löschdiskussion hatte ich vorhin eine Idee, die ich hier eins zu eins wiederhole, da der Ort, um sie zu diskutieren, hier ist und nicht dort:
Was die Länge der Seite angeht, so sehe ich die Bedenken durchaus ein, und die Frage wäre, ob man nicht eine technische Lösung finden könnte. Mir schwebt vor, auf der Lemma-Seite tatsächlich nur eine allgemeine Einleitung zu platzieren und dann Links auf Einzelseiten der verschiedenen Unicode-Blöcke. So kann man sich auch mit einem langsameren Computer die Teile des Unicode, die gerade interessieren, schnell und gezielt ansehen. Und für diejenigen, die gern alles auf einen Blick hätten, könnte man doch eine Seite herstellen, auf der die Informationen der Einzelblock-Seiten über die Vorlagen-Technik eingebunden werden (so dass zwar doppelt vorhanden wären, aber nur einmal bearbeitet werden müssten). Dann noch eine Unicode-Navigationsleiste für die Einzelseiten, die mit dem <noinclude>-Tag versehen werden – da ließe sich etwas machen...
Nachtrag: Eine solche aus Vorlagen-Aufrufen aufgebaute Gesamtseite könnte dann vielleicht auch die bisher ausgelagerten CJK-Blöcke enthalten, denn es müsste ja niemand die Gesamtseite als solche im Edit-Fenster bearbeiten.
Noch ein Nachtrag: Man müsste wirklich nicht für jeden Block eine Unterseite machen; hier hat jemand den gesamten Unicode in 15 Teile geteilt. --Daniel Bunčić 13:22, 5. Sep. 2007 (CEST)

Wenn aufgeteilt wird, dann schlage ich diese Einzelteile vor:
U+0000  - U+0FFF
U+1000  - U+1FFF
U+2000  - U+2FFF
U+3000  - U+33FF
U+3400  - U+4DFF
U+4E00  - U+9FFF
U+A000  - U+ABFF
U+AC00  - U+D7AF
U+F900  - U+FFFF
U+10000 - U+19FFF
U+1A000 - U+1FFFF
U+20000 - U+2FFFF
U+E0000 - U+EFFFF
Macht 13 Teile, sinnvoll aufgeteilt (nach momentaner Unicode-Version). -- Prince Kassad 13:38, 5. Sep. 2007 (CEST)
Hier ist das Ganze noch etwas übersichtlicher abgebildet. --Reiner Stoppok 22:56, 11. Sep. 2007 (CEST)
Bei 154151 Blöcken ist eine Aufteilung nach Unicode-Block ausgeschlossen, bei so vielen Einzelteilen wird das zu unübersichtlich. -- Prince Kassad 22:59, 11. Sep. 2007 (CEST) (nachtrag: PUA zählt nicht)
Stimmt auch wieder. Die Unicode-Blöcke sollen also zu Wikipedia-Blöcken zusammengefasst werden, damit sich schneller mit ihnen arbeiten läßt. Wenn das mal nicht zu kompliziert wird. --Reiner Stoppok 00:26, 12. Sep. 2007 (CEST) PS: Solange auf einer einzigen Seite die Benennungen irgendwie zusammenlaufen - jetzt mal egal, wie lange man auf deren Aufbau warten muss - ist mir jede Arbeitslösung recht.
Wenn man mit der "Vorlagen-Technik" arbeitet, ist das dann so, dass die Änderung an der einen Stelle/Seite auch gleich an der anderen erfolgt, und umgekehrt? Nicht, dass da viele Nebenschauplätze entstehen. Die Diskussionen sollten sich schon alle hier abspielen. --Reiner Stoppok 21:27, 11. Sep. 2007 (CEST)
Ja, soweit es die m:Job queue ermöglicht. -- Prince Kassad 21:29, 11. Sep. 2007 (CEST) (Nachtrag: aber man kann nur an einer Stelle editieren...)
Dann würde ich vorschlagen, die Hauptseite zum Edieren und Diskutieren zu benutzen. Die - sicherlich noch nachzubessernde und übersichtlicher zu gestaltende - Liste der Unicode-Blöcke liefert ja schon die Überschriften zu den einzelnen Blöcken und evtl. kurze Einführungen dazu. Also: a) die Seite mit allen Symbolen und Bezeichnungen, wo ediert und diskutiert wird b) die Seiten mit den einzelnen Blöcken für den eiligen Benutzer. --Reiner Stoppok 21:49, 11. Sep. 2007 (CEST)
Die einzelnen Blöcke werden dann per Vorlagensyntax in eine Seite eingebunden, um die komplette Liste zu erhalten - so hast du das geplant, oder? (in die andere Richtung funktioniert es nur bei Wikisource) -- Prince Kassad 21:56, 11. Sep. 2007 (CEST)
Es funktioniert in der Tat nur so, dass man die kleinen Einzelseiten bearbeiten kann und dann auf einer großen Seite alle diese Einzelseiten per Vorlagensyntax einbindet. Aber das ist ja auch der Sinn der Sache, dass man beim Editieren eben keine Megabytes ins Bearbeitungsfenster lädt. Die Diskussion kann man ja durch einen Hinweis auf der Diskussionsseite oder gar eine Weiterleitung hierher leiten.
Mit Prince Kassads Vorschlag der Aufteilung des gesamten Unicodes in 13 große Blöcke habe ich das Problem, dass dabei Zusammenhängendes getrennt wird, während Nichtzusammenhängendes zusammen bleibt, z.B. wären in dem ersten von Dir vorgeschlagenen Block europäische Alphabete, semitische Abjads und einige indische Schriften, und im zweiten Block wären weitere indische Schriften. Die Frage wäre, ob man entweder versucht, sinnvoll Zusammenhängendes auf je einer Seite unterzubringen, oder stur nach der Zahl geht (dann aber auch ganz stur, je 4096 Zeichen pro Seite) oder ob es nicht am sinnvollsten sein könnte, für jeden Unicode-Block eine eigene kleine Unterseite zu machen. Das hätte den Vorteil, dass wir eine Gliederung vornehmen, die sozusagen offiziell ist, und auch für die Einzelseiten praktische Namen zur Verfügung haben. Dann würde man also eine Seite Basis-Lateinisch, eine Seite Lateinisch-1, Ergänzung, eine Seite Lateinisch, erweitert-A usw. haben, in jeder würde natürlich stehen, dass sie zur Liste von Unicode-Zeichen gehört (warum eigentlich nicht Liste der Unicode-Zeichen?), es gäbe außerdem eine Navigationsleiste durch alle Unicode-Blöcke, und wer möchte, könnte sich eine Seite anschauen, auf der für jeden Block eine {{...}}-Einbindung steht. Obendrein könnten diese Einzelseiten auch für Seiten, die ein bestimmtes Schriftsystem beschreiben, einfacher mitgenutzt werden (im Extremfall sogar durch eine weitere Vorlageneinbindung). Meines Erachtens wäre das die eleganteste Lösung. Was meint Ihr? --Daniel Bunčić 16:42, 15. Sep. 2007 (CEST)
Wie ich schon erwähnt hab, hätten wir dann um die 120 Einzelseiten, und das ist sehr viel. Könnte man vielleicht zusammenhängende, miteinander verwandte Blöcke zusammenfassen? (wie z. B. Yi-Silben und Yi-Radikale in ein "Yi") -- Prince Kassad 16:51, 15. Sep. 2007 (CEST)
a) Bringt es irgendeinen Nachteil, viele Unterseiten zu haben?
b) Gegen das Zusammenfassen spricht grundsätzlich nichts. Nur muss man sich dann bei jeder Seite fragen, was man im Einzelnen zusammenfassen will. Klar, auch "Kyrillisch" und "Kyrillisch, Ergänzung" wären natürlich solche Kandidaten, da wäre ich sogar sehr fürs Zusammenfassen. Aber wenn man nicht zu kühnen Rundumschlägen wie "Europäische Alphabete" oder so greift (wo immer noch etwas fehlen wird, weil am Ende der Tabelle noch einiges nachgetragen wurde), sondern nur die offensichtlichen Dinge zusammenfasst, hat man wahrscheinlich immer noch um die 80 Seiten. --Daniel Bunčić 17:07, 15. Sep. 2007 (CEST)
Der Nachteil von vielen Unterseiten ist, außer Beschwerden von Admins, dass sie die Beobachtungsliste schnell auffüllen und die Überwachung dann schwer wird. (Kyrillisch würde ich nicht zusammenfassen, in Unicode 5.1 kommt Erweiterung A und Erweiterung B dazu) -- Prince Kassad 17:10, 15. Sep. 2007 (CEST)
Hm, das habe ich nicht ganz verstanden. Wenn jemand zehn Änderungen in zehn verschiedenen Unicode-Blöcken der jetzt bestehenden großen Seite macht (wozu er jedesmal nur den Abschnitts-Edit-Button drückt, um nicht den gesamten unübersichtlichen Text in seinem Fenster zu haben), fehlen mir neun der tatsächlich vorgenommenen Edits auf meiner Beobachtungsliste. Wenn jeder dieser Edits auf einer eigenen Seite stattgefunden hat, habe ich alle Edits auf meiner Liste.
Wie dem auch sei – wäre es ein sinnvolles Vorgehen, erst einmal blockweise auszulagern und dann zu schauen, was man davon eventuell zusammenfasst? --Daniel Bunčić 17:23, 15. Sep. 2007 (CEST)
Ich stehe da nicht im Weg, aber bitte GFDL-konform auslagern, um Ärger zu vermeiden. -- Prince Kassad 17:29, 15. Sep. 2007 (CEST)
Was heißt das? Was wäre denn nicht GFDL-konform? --Daniel Bunčić 17:59, 15. Sep. 2007 (CEST)
Die GFDL will die komplette Versionsgeschichte, und andere Sachen. Steht bestimmt auch irgendwo auf Wikipedia, hab nur gerade den Link nicht zur Hand. -- Prince Kassad 18:03, 15. Sep. 2007 (CEST)

Unter Vollständige Liste der Unicode-Zeichen habe ich mal einen Anfang gemacht, damit man sieht, wie das aussehen könnte. In Vorlage:Navigationsleiste Unicode habe ich die geplanten Namen eingetragen; diese Seiten könnte man durch Klick auf den roten Link in der Tabelle erzeugen und aus dem entsprechenden Abschnitt der Seite Liste von Unicode-Zeichen kopieren.
Dabei sollte man lediglich zum einen gemäß Reiner Stoppoks Vorschlag die ersten beiden Zeilen der Tabelle durch diese ersetzen:

 {| class="prettytable sortable"
 |- class="hintergrundfarbe5"

Zum anderen gehört ganz ans Ende der Seite dieser Code:

 <noinclude>
 {{Navigationsleiste Unicode}}
 </noinclude>

Was haltet Ihr davon? --Daniel Bunčić 15:30, 16. Sep. 2007 (CEST)

Sobald ich Zeit dazu habe, werde ich das auch machen. -- Prince Kassad 15:34, 16. Sep. 2007 (CEST)
Vielen Dank, ich muss mich jetzt auch erst einmal wieder anderen Dingen widmen.
Gerade fällt mir auf, dass, wenn alle Tabellen aus Liste von Unicode-Zeichen ausgelagert sind, diese Seite mit Liste der Unicode-Blöcke vereinigt werden könnte, wobei eine sehr praktische Übersichtsseite entstehen könnte. Womöglich könnte man diese Liste dann sogar in Unicode einbinden, dann hätte man alles beisammen. Aber das sind erst die nächsten Schritte, erst einmal die Auslagerung (und ggf. die Einbindung der englischen Originalbezeichnungen zusätzlich zu den Übersetzungen gemäß Löschdiskussion). --Daniel Bunčić 15:45, 16. Sep. 2007 (CEST)

Hiragana-Buchstabe

Die japanische Silbenschriften Hiragana und Katakana besteht aus Zeichen und nicht aus Buchstaben. --Laben 17:49, 5. Sep. 2007 (CEST)

Wikipedia:Sei mutig! -- Prince Kassad 17:52, 5. Sep. 2007 (CEST)
Ich schlage die Bezeichnung Silbenzeichen vor (vgl. [1]). --Reiner Stoppok 21:14, 11. Sep. 2007 (CEST)
Ich habe Buchstaben in Zeichen geändert. Die Umschrift im Artikel folgt nicht dem Hepburn-System. Gibt es dafür Gründe? --Laben 20:52, 25. Sep. 2007 (CEST)
Dieser Artikel wird bald entfernt werden, du solltest die Änderung nochmal in Unicode-Block Hiragana durchführen. Warum die Umschrift nicht dem Hepburn-System entspricht, kann ich dir spontan nicht sagen. -- Prince Kassad 22:29, 25. Sep. 2007 (CEST)
Das habe ich bereits erledigt. --Daniel Bunčić 10:36, 26. Sep. 2007 (CEST)
Vielleicht weil es im Hepburn-System störende Homonyme gibt: zweimal ji und zweimal zu anstatt di/zi und du/zu. Gismatis 00:37, 26. Sep. 2007 (CEST)

Sortierbare Tabellen

Vielleicht könnte man auch mit sortierbaren Tabellen arbeiten (hier eine Probe (Bitte auf das Zeichen rechts von "Beschreibung" klicken)), wie ist da die Meinung? --Reiner Stoppok 12:19, 12. Sep. 2007 (CEST)

Ich hätte nichts dagegen. -- Prince Kassad 16:13, 12. Sep. 2007 (CEST)
Ich auch nicht, schöne Idee. --Daniel Bunčić 17:09, 15. Sep. 2007 (CEST)

Bezeichnungen ohne diakritische Zeichen

Nach dem Muster von "DŽ" (Lateinischer Großbuchstabe DZ-Digraph mit Hatschek) würde ich auch Bezeichnungen wie Kyrillischer Großbuchstabe Ž, ... Ć ... Š ... Č usw. umgestalten (also: Z mit Hatschek, C mit Akut usw.), denn sonst werden die bei der Benennung verwendeten Zeichen (die den Slavisten natürlich wohlvertraut sind ...) gleich wieder zum Problem. Die englischen Unicode-Bezeichnungen sind völlig (!)sonderzeichenfrei und haben das Problem der Groß- und Kleinschreibung auch nicht! --Reiner Stoppok 16:29, 12. Sep. 2007 (CEST)

Ich finde, auf Sonderzeichen sollte wenn möglich verzichtet werden, denn das ist ja meines Erachtens auch der Sinn der Umschreibung. Sonst bräuchten wir ja nicht z. B. "Lateinischer Großbuchstabe C mit Hatschek" zu schreiben, sondern könnten gleich "Lateinischer Großbuchstabe Č" schreiben. Für besser hielte ich es darum, die Originalnamen zu übernehmen (Möglichkeit 1). Für noch besser hielte ich es aber, die Originalnamen gemäß den Namenskonventionen einzudeutschen (Möglichkeit 2). Für Kyrillisch bedeutete dies also z. B Ж = ZHE = Sche, Ш = SHA = Scha usw. (Siehe Wikipedia:Namenskonventionen/Kyrillisch). Bei Möglichkeit 1 würde uns vorgeworfen werden, die Beschreibungen nur halb zu übersetzen (siehe Löschbegründung), bei Möglichkeit 2 würde der Vorwurf der Begriffsfindung erhoben. Was wäre besser? Für Möglichkeit 2 müsste allerdings vorgängig gründlich geprüft werden, ob und welche Schwierigkeiten auftauchen, z. B. ob Homonyme dabei rauskommen könnten, was natürlich auf keinen Fall passieren dürfte. Noch völlig offen ist das Problem der Groß- und Kleinschreibung, das allerdings ein kleines Problem sein wird. Gismatis 04:10, 13. Sep. 2007 (CEST)

Wenn man diese schrecklichen (russischen, nicht etwa allgemeinkyrillischen!) "Buchstabennamen" a, bä, wä, gä usw. (die keine echten Namen sind, genauso wenig wie dt. a, bee, cee, dee usw.) aus der englischen Unicode-Liste übernimmt, dann hat man keine Probleme mit Homonymien, weil dann "es" (с) von "se" (з) und "scha" (ш) von "sche" (ж) unterschieden ist, auch wenn kein normaler Nicht-Kyrilliker diesen Unterschied durchschauen wird, er wird "sche" ebenso stimmlos aussprechen wie "scha". Daher war ich auf die wissenschaftliche Transliteration ausgewichen, die in dieser Hinsicht deutlich sinnvoller ist als die Duden-Transkription (vgl. Kyrillisch#Beispiele für die Umschrift von Namen). Die englische Sprache hat hier einfach nicht dieses Problem, weil dort "z" immer stimmhaft ist und man deshalb "es", "ze", "sha" und "zhe" sehr gut auseinanderhalten kann. Außerdem ist es gerade typisch englisch, dass man auf Diakritika verzichtet (die haben ja noch nicht einmal Umlaute!), und in einer Sprache, deren Orthographie bereits Diakritika hat, wie das Deutsche, könnte man doch für die Transkription fremder Schriften gut lateinische Buchstaben mit Diakritika verwenden, finde ich. --Daniel Bunčić 14:42, 13. Sep. 2007 (CEST)

Windows 95 z. B. hat Umlaute, aber kein Hatschek. Dessen Benutzer werden beim Versuch, die wissenschaftliche Transkription zu lesen, Probleme kriegen. -- Prince Kassad 15:10, 13. Sep. 2007 (CEST)
Ich finde auch, auf die Sonderzeichen sollte gänzlich (!) verzichtet werden. Es geht hier ja nicht um die "Transkription fremder Schriften", sondern einfach nur um die Benennung von Zeichen, die in bestimmten Schriften vorkommen. Es gibt schließlich auch noch jede Menge Nicht-Schrift-Symbole bei Unicode (z.B. das Recyclingsymbol). Ich würde immer den Unicode-Weg der Benennung über die äußere Gestalt vorziehen. Alles andere setzt zu viele Vorkenntnisse der Einzelsprachen und -schriften voraus. --Reiner Stoppok 17:03, 13. Sep. 2007 (CEST) PS: BLACK UNIVERSAL RECYCLING SYMBOL (U+267B) "Schwarzes Recyclingsymbol"
Dass du die originalen Pseudo-Buchstabennamen schrecklich findest, kann ich nachvollziehen. Du musst aber bedenken, dass dies nicht unser Problem ist, sondern das des Unicode-Konsortiums. Wir machen absolut nichts falsch, wenn wir diese "schrecklichen" Namen übernehmen. Was die Nachvollziehbarkeit der Aussprache für Laien betrifft, so ist die wissenschaftliche Transliteration ebenso wenig eine Hilfe. Im Gegenteil. Ein Laie wird Ž dem Lautwert ts zuordnen, während er bei Scha viel näher an der originalen Aussprache dran ist. Dass in der deutschen Sprache Diakritika häufiger verwendet werden als im Englischen kann ich mir gut vorstellen. Aber auch im Deutschen gibt es eine "Rangfolge" bei Sonderzeichen. Den höchsten Rang haben natürlich die Umlaute und ß. Dann folgen Sonderzeichen aus den wichtigen europäischen Sprachen. Was allerdings darüber hinausgeht, gilt bestimmt als ebenso exotisch, wie im Englischen.
Der Vorteil beim Verzicht auf Sonderzeichen liegt meiner Ansicht nach hauptsächlich in der Aussprechbarkeit der Namen, und damit verbunden, eine bessere Merkbarkeit. Für einen Laien ist Scha einfach viel besser zu behalten als Š.
Ich schlage daher folgenden Kompromiss vor: Wir richten uns grundsätzlich nach den Namenskonventionen für Kyrillisch. Wenn der kyrillische Buchstabe eindeutig durch einen lateinischen Buchstaben des lateinischen Basisalphabets beschrieben werden kann, nehmen wir diesen ohne Vokalzusatz, also B nicht Be, F nicht Ef usw. Wenn ein Buchstabe mehrdeutig wäre, nehmen wir den Vokal gemäß der Originalbezeichnung dazu, also Se für З und Es für С. Ebenfalls befürworte ich den Vokalzusatz bei Buchstabenkombinationen zwecks besserer Aussprechbarkeit: also Cha statt Ch, Tsche statt Tsch. Das führt zu folgendem Ergebnis:
Ѐ: Je mit Gravis, Ё: Jo, Ђ: Dje, Ѓ: Gje, Є: Ukrainisches Je, Ѕ: Dse, І: Weißrussisch-Ukrainisches I, Ї: Ji, Ј: J, Љ: Lje, Њ: Nje, Ћ: *, Ќ: Kje, Ѝ: I mit Gravis, Ў: Kurzes U, Џ: Dsche, А: A, Б: B, В: W, Г: G, Д: D, Е: Je, Ж: Sche, З: Se, И: I, Й: Kurzes I, К: K, Л: L, М: M, Н: N, О: O, П: P, Р: R, С: Es, Т: T, У: U, Ф: F, Х: Cha, Ц: Z, Ч: Tsche, Ш: Scha, Щ: Schtscha, Ъ: Hartes Zeichen, Ы: Jery, Ь: Weiches Zeichen, Э: E, Ю: Ju, Я: Ja
*Zu Ћ: Das Original lautet Tshe. "Tsche" darf es aber nicht heißen, weil bereits Ч so heißt. Möglich wären Tche (gemäß der Aussprache) oder Serbisches Tsche.
An der wissenschaftlichen Transliteration kritisiere ich, dass sie zwar Ю und Я mit Ju und Ja wiedergibt, E und Ё jedoch mit E und Ë, was bei Ersterem zur Verwechslung mit Э füht und bei Letzterem zu einer völlig falschen Aussprache verleitet. Gismatis 04:05, 18. Sep. 2007 (CEST)

Die "Benennung über die äußere Gestalt" gibt es bei Unicode aber nur bei zusammengesetzten Buchstaben. "Cyrillic capital letter Zhe" sagt doch über die Form überhaupt nichts, kein Stück mehr als "Kyrillischer Großbuchstabe Ž". Übrigens benutze ich bis heute immer noch Word für Windows 95 und schreibe damit seit zwölf Jahren problemlos u.a. meinen Namen, auch meine slavistische Doktorarbeit mit sehr vielen Sonderzeichen habe ich mit diesem alten Programm geschrieben. Es gibt also gar keinen Zweifel, dass auch Windows 95 schon "einen Hatschek hatte" (diese Proseminararbeit entstand noch unter Windows 95). Abgesehen davon, wer benutzt heute noch ein zwölf Jahre altes Betriebssystem? Da könnten wir genauso gut sagen, Wikipedia solle nur ASCII benutzen. Aber die Wikipedia setzt ja gerade konsequent auf Unicode auch im Fließtext – warum also nicht auch die Beschreibungen auf dieser Seite?
P.S. Dieses Problem würde sicher geringer, wenn man außer der deutschen Beschreibung auch das Original hätte. --Daniel Bunčić 16:58, 15. Sep. 2007 (CEST)

Ich weiß ja nicht, welche Version von Windows 95 du hast, aber ich habe die Urversion auf englisch und da gibt es kein Hatschek. Das "Česky" links in der Interwiki-Liste erscheint als "□esky". (PDFs sind betriebssystemunabhängig, da die Schrift ins PDF kompiliert ist) -- Prince Kassad 17:05, 15. Sep. 2007 (CEST)
Man musste, um den Hatschek zu sehen, in der Systemsteuerung eine "Sprachenunterstützung" aktivieren, die auf der Windows-CD (bzw. den Windows-Disketten) mitgeliefert war. Wer sich für Gebiete östlich der Oder-Neiße-Linie interessierte, hat das natürlich getan.
Das PDF habe ich natürlich erst 2007 erzeugt, es ging mir darum, dass ich diesen Text tatsächlich anno 1996 mit Word 95 unter Windows 95 geschrieben habe (und nur den o-Nasal nicht aus Times New Roman nehmen konnte, sondern selbst basteln musste). --Daniel Bunčić 17:15, 15. Sep. 2007 (CEST)
Das muss ich mir beim nächsten Mal ansehen. Es ist zu lange her, dass ich mich ernsthaft mit Windows 95 und Schriften befasst habe, seit ich meinen Hauptrechner habe, der sowieso 97% von Unicode unterstützt. -- Prince Kassad 17:18, 15. Sep. 2007 (CEST)
Eine genaue Beschreibung (inzwischen ebenso veraltet wie Windows 95) findet man z.B. auf Christoph Singers slovo-Server. --Daniel Bunčić 18:04, 15. Sep. 2007 (CEST)
Die Bezeichnungen für die Zeichen müssen auch völlig von Groß- [besser:Gross] und Kleinschreibung unabhängig sein (egal ob ich einen Namen klein oder gross oder gemischt eingebe), schließlich geht ja die Beschreibung schon aus dem Wortlaut hervor. Unicode z.B. schreibt alles groß [besser: gross] und nur mit den Tasten der 26 Lateinbuchstaben! --Reiner Stoppok 14:52, 16. Sep. 2007 (CEST) Der Buchstabe ö ist der Lateinischer Kleinbuchstabe o mit Trema, und nicht etwa: Lateinischer Kleinbuchstabe ö und das ß ist nicht der Lateinische Kleinbuchstabe ß (sondern: LaTeINIscHer KlEINbuCHstABe ScHArfEs S). Das müsste so auch für die kyrillische Buchstaben machbar sein. Vielleicht sollte dieser Punkt der völligen Unabhängigkeit von Gross- und Kleinschreibung in einem eigenen Absatz diskutiert werden. Der der Beschränkung auf 26 Lateinbuchstaben vielleicht ebenfalls.
Die Beschränkung auf das lateinische Basisalphabet sollte in diesem Abschnitt diskutiert werden. Die Frage der Groß- und Kleinschreibung sollte demnächst in einem neuen Abschnitt diskutiert werden. Da im Moment so viele Diskussionen am Laufen sind, kann dies aber meiner Meinung nach noch etwas warten. Gismatis 04:05, 18. Sep. 2007 (CEST)
Die Löschdiskussion hat ergeben, dass wir in der Wikipedia keine Übersetzung der offiziellen Bezeichnungen anfertigen können, da das nicht Sache der Wikipedia ist. Folglich werden auch unsere deutschsprachigen Angaben niemals zu einer solchen Anwendung kommen, dass nun jemand "LaTeINIscHer KlEINbuCHstABe ScHArfEs S" in irgendeine Tabelle tippt und hofft, "ß" herauszubekommen. Wenn wir aber nur eine deutschsprachige Erklärung für die Wikipedia-LeserInnen bieten (welche in denjenigen Fällen, in denen die Originalbezeichnung hinreichend klar ist, mit einer wörtlichen Übersetzung übereinstimmt), sollten wir uns auch an den Duden und die Wikipedia-Gepflogenheiten der Rechtschreibung halten. --Daniel Bunčić 11:26, 18. Sep. 2007 (CEST)
Die "Beschränkung auf 26 Lateinbuchstaben" (x2) müsste natürlich im Deutschen um ä,ö,ü,ß (x2) erweitert werden (Groß- statt Gross- fände ich auch besser). Der Admin in der Löschdiskussion hat lediglich eine Empfehlung ausgesprochen. Mehr nicht. Keine Bange. --Reiner Stoppok 14:33, 18. Sep. 2007 (CEST)
Aber selbstverständlich dürfen wir eine Übersetzung anfertigen! Wir können bloß keine offizielle Übersetzung bereitstellen. Unsere Aufgabe sehe ich darin, dem deutschsprachigen Leser die englischen Originalbezeichnungen mit einer Übersetzung verständlich zu machen. Dass du die deutsche Übersetzung als Erklärung interpretierst, die völlig unabhängig von der Originalbeschreibung sein soll, ist ein völlig neuer Ansatz. Ich glaube, wir brauchen doch nochmal eine Grundsatzdiskussion! Gismatis 00:09, 19. Sep. 2007 (CEST) PS: Was haltet ihr von meinem Kompromissvorschlag?
(Der alte Diskussionsbeitrag wurde präzisiert und überschrieben:) Ein Posten mehr für "Geklärte Fragen", Gismatis! Das war ja gerade unser Hauptansatzpunkt, notfalls auch Übersetzungen bereitzustellen. Wir nehmen aber grundsätzlich natürlich erst einmal das, was wir bereits in deutschem Gebrauch vorfinden. Und falls wir da nichts entdecken können, ziehen wir das englische Original oder die Beschreibung von Microsoft oder sonstwem zu Rate. Aber die Übersetzungen von nicht bereits im Deutschen geprägten Begriffen machen doch eigentlich nur einen sehr geringen Anteil aus. --Reiner Stoppok 14:12, 19. Sep. 2007 (CEST)--Reiner Stoppok 02:53, 19. Sep. 2007 (CEST) PS: Der die Löschkandidatenliste abarbeitende Admin hatte in dem Unicode-Schlamassel m.E. auch nicht ganz so tief drin gesteckt (wie wir z.B. gerade bei den noch offenen Fragen).

Die englischen Originalbezeichnungen

Was ist eigentlich mit den englischen Originalbezeichnungen? Sollten die nicht ebenfalls in die Listen? Benutzer:W!B: meint in diesem Löschbeitrag, im Artikel sollten sogar nur diese aufgeführt werden. Das eigentliche Problem ist jedoch, dass im Moment der Übersetzungscharakter der Bezeichnungen wirklich nicht rüberkommt und daher der Vorwurf der Begriffsfindung nicht so leicht entkräftet werden kann. Ich finde also, wir sollten die Originalbezeichnungen durchaus mitaufführen. Es sollte auch klar werden, dass nur die englischen Beschreibungen offiziell sind, und es sich bei den deutschen Beschreibungen nur um eine Übersetzung handelt. Natürlich wäre dies erst nach einer Aufteilung des Artikels möglich. Gismatis 04:14, 13. Sep. 2007 (CEST)

Warten wir erstmal ab, ob überhaupt aufgeteilt wird (bzw. werden soll). Wenn nein, fällt die Möglichkeit aus. -- Prince Kassad 14:15, 13. Sep. 2007 (CEST)
Doch, die müssen sogar rein, solange die offiziellen Stellen, die für Unicode zuständig sind, keine deutschen Namen herausgeben (und das werden sie vermutlich nicht tun). Und *bitte*, teilt die Liste auf, das würde wirklich sehr helfen. Ihr könnt ja eine Navileiste machen (einen Überblicksartikel Unicode gibts ja schon). Ich habe bei der LA-Entscheidung bis Ende des Jahres Zeit gegeben, die Namen der Zeichen einzutragen. Wenn ihr das nicht schafft, aber zumindest erkennbar ist, dass ihr daran arbeitet, dann ist das natürlich auch ok. --Thogo BüroSofa(in memoriam) 16:02, 13. Sep. 2007 (CEST)
  1. Wenn die Seite nicht aufgeteilt wird, und die Beschreibungen hinzugefügt werden, wäre das um die 450 KB, die dann kein Browser der Welt ohne Absturz anzeigen könnte.
  2. Siehe LA-Diskussion.
  3. Reicht nicht einfach ein Link zu den PDF-Tabellen unter einem Abschnitt "Einzelnachweise" (pro Abschnitt, sonst wird das zu unübersichtlich)? -- Prince Kassad 16:53, 13. Sep. 2007 (CEST)
Als ich mit der Liste angefangen hatte, stellte ich mir natürlich auch die Frage, ob ich die englischen Originalbezeichnungen stehen lassen sollte (was ein leichtes gewesen wäre, da ich sie ja zunächst für die Tabelle aus dem Englischen rüberkopiert hatte). Ich fand aber, das Englische lenkt zu sehr ab. Wenn man zu sehr auf das Englische schielt, kommen eben Übersetzungen heraus, die von den Sprechern der deutschen Sprache nicht recht angenommen werden. Wer die Originalbezeichnung kennenlernen will, dem steht es doch frei, sie auf äußerst bequemen anderen Wegen zu suchen. --Reiner Stoppok 17:16, 13. Sep. 2007 (CEST) PS: Wie "offiziell" ist eigentlich die frz. Unicode-Übersetzung?

Deutsche Bezeichnungen

Ich störe mich ein bisschen am Ausdruck "Rautenzeichen", denn ich halte "Nummernzeichen" für richtig, siehe DIN 5008. Siehe aber auch diese Seite, dann sieht man, dass die Materie noch etwas schwieriger ist. Ich muss sagen, eine Spalte mit den englischen Bezeichnungen hätte ich als Ergänzung trotzdem auch gut gefunden, damit man hier mal einen Bildungs-Push machen kann. –– Simplicius 13:37, 13. Sep. 2007 PS: Klasse Liste, ich gratuliere!

Wenn schon eine DIN-Norm den Namen vorgibt, dann wäre das der willkommene Anlass, das zu ändern. -- Prince Kassad 14:13, 13. Sep. 2007 (CEST)
Nummernzeichen wäre wohl besser! Zur englischen Spalte siehe meine Bemerkung oben. Ich hätte natürlich auch nichts gegen eine französische einzuwenden. - Ich finde aber, unsere Kräfte sollten darauf konzentriert werden, zunächst einmal die deutschen Benennungen sinnvoll von überall her, wo wir sie vorfinden, hier einzubringen, ohne uns von irgendwelchen anderen Benennungsversuchen ablenken zu lassen. Ich habe mich vor Jahren höchstpersönlich beim Unicode-Consortium über die Schwachsinnsbenennung "ideographic" für chinesische Schriftzeichen aufgeregt, und siehe da: das ist inzwischen verschwunden. Das sind also keine Betonköpfe bei Unicode, sondern die basteln selber immer weiter an Verbesserungen. --Reiner Stoppok 17:35, 13. Sep. 2007 (CEST) PS: Wikipedia hat sowohl zu Rautenzeichen als auch zu Nummernzeichen einen Artikel.
Ok, also mein Vorschlag, wir sollten es so machen, wie es in der Vorläufigen Entscheidung in der Löschdiskussion als sachdienlich angemahnt wurde, und zumindest bei den Sonderzeichen eine Spalte für die originalen englischen Bezeichnungen machen.
Ansonsten, ob da nun "Latin A" oder "Lateinisches A" steht, macht ja den Kohl nicht fett.
Wenn man Arbeitsteilung machen sollte, würde ich eine Tabelle übernehmen. –– Simplicius 18:24, 13. Sep. 2007 (CEST)
Das heißt Nummernzeichen. Raute heißt das Symbol auf der Telefontastatur. Da wird es allerdings korrekterweise durch 2 Paare senkrecht aufeinanderstehender Linien dargestellt. Wodurch innen ein Quadrat ist, welches üblicherweise nicht Raute genannt wird. -- Rainer Seitel

Vorschlag Portal

Ich hätte noch einige Fragen mehr zum Thema Zeichen, Zeichensätze, Fonts usw. Wäre nicht ein Projekt oder Portal die beste Anlaufstelle für eine Qualitätssicherung? –– Simplicius 18:16, 13. Sep. 2007 (CEST)

Portal:Unicode, ich bin dabei. --Reiner Stoppok 20:27, 13. Sep. 2007 (CEST) PS: Solange das nicht von der Arbeit hier ablenkt.
Ich würde auch mitarbeiten. -- Prince Kassad 20:33, 13. Sep. 2007 (CEST) (Nachtrag: allerdings eher ein WikiProjekt, denn bei einem Portal sehe ich die Gefahr von Überschneidungen.)
Meine Idee dabei ist, dass wenn so Fragen auftauchen wie beim "Rautenzeichen" bzw. "Sonderzeichen", dass man sich dann in einem Bereich bewegt, der mit dieser Seite zusammenhängt, aber auch darüber hinaus geht − und alle betreffen sollte, die sich über solche Fragen und Artikel allgemein Gedanken machen.
Ich habe gesucht, wo es so etwas schon gibt. Was die »Schwarze Kunst« angeht, haben wir ein Portal namens Portal:Schrift. Das Projekt:Schrift wurde 2006 abgeschossen.
Portal und Projekt wären vielleicht ein guter Stützpunkt. Es bedeutet natürlich nicht, dass man sich über mehr als über Unicode Gedanken machen muss, aber immerhin wäre das dann möglich. Und es würde vielleicht mehr Benutzer zusammenbringen. Löschanträge müssen ja nicht die einzige Art der Publicity sein.
Ich weiss jetzt nicht, was da mal im Projekt einst stand. Dazu braucht man Adminrechte. Vielleicht wäre ein Neustart mit einer Liste von Benutzern, die mitmachen, einer Liste neuer Artikel und einer Diskussion auch schon völlig ausreichend.
Zum anderen muss man aber auch mal fragen, wie die Zukunft für "Projekte" aussehen soll, siehe Wikipedia:Fragen zur Wikipedia#Brauchen wir noch WikiProjekte? –– Simplicius 11:06, 14. Sep. 2007 (CEST)
WikiProjekte sind auf jeden Fall noch sinnvoll, und für eben solche Fragen wie Benennungs- oder Gestaltungsfragen ist ein WikiProjekt da. Wie müssten nur genug Mitarbeiter sammeln, um damit an den Start zu gehen. (ich bin eher gegen ein Portal, da ich nicht weiß, was es für spannende Unicode-Themen gibt, außer den einzelnen Buchstabenartikeln.) -- Prince Kassad 13:40, 14. Sep. 2007 (CEST)
Die Bonus-Frage lautet ja sogar "Redaktion oder Projekt"... –– Simplicius 16:51, 14. Sep. 2007 (CEST)
Ich finde, die Bezeichung Portal:Unicode klingt seriöser und eindeutiger, sie macht auch viel mehr her. Darum geht es schließlich. Die damit verbundenen Probleme sind groß und vielgestaltig genug, was bestimmt niemand von uns am Anfang vermutet hätte. Die Bezeichnung "Portal:Schrift" trifft es meiner Meinung nach nicht so richtig (denkt mal an das "Recyclingzeichen"). --Reiner Stoppok 23:51, 14. Sep. 2007 (CEST)
Damit hast du durchaus recht, Reiner, doch zwei Punkte lass mich da mal anmerken: Hast du schon mal ein eigenes Portal gebastelt? Das ist viel Arbeit. Und was ist, wenn das Interesse wieder nachläßt, wenn man nicht mehr drei, zwei, sondern einen oder gar keinen Mitarbeiter mehr hat? Dann fehlt die Betreuung und es entsteht ein verwaistes Portal. Deswegen sollte man nach meiner Meinung immer vorher sicherheitshalber schauen, ob man Vorhandenes nutzen kann, wenn es einigermaßen paßt, und personell auch die Synergien nutzen. –– Simplicius 09:36, 15. Sep. 2007 (CEST)
Ich finde, Redaktionen sind ein "Geschenk" für besonders gelungene WikiProjekte und sehr schwer zu verdienen. Deswegen gibt es auch nur Redaktionen für große Themen wie z. B. Chemie. -- Prince Kassad 10:42, 15. Sep. 2007 (CEST)
Ok, ich wanke. Vielleicht sollten wir alles so belassen, Prince Kassad & Simplicius!? Die Gefahr, dass da etwas verwaist, halte ich für ausgeschlossen, da zukünftig doch wohl immer wieder Klärungsbedarf diesbezüglich bestehen wird, der den Laden automatisch in Schwung hält. Es sollten aber bereits jetzt die vorhandenen Kräfte sinnvoll kanalisiert werden. Und das geht m.E. nur etwas plakativ und grossprotzig. --Reiner Stoppok 15:13, 15. Sep. 2007 (CEST) PS: Bestimmt hat es Prince Kassad am besten im Gefühl, was hier und jetzt sinnvoll ist. Schließlich hat er auch das meiste für die Liste getan.
Ein WikiProjekt halte ich immer noch für sinnvoll. Besser, als unsere eigenen Diskussionsseiten oder diese Seite als Ersatz zu missbrauchen. -- Prince Kassad 15:31, 15. Sep. 2007 (CEST) Auf Wunsch: Wikipedia:WikiProjekt Unicode ist genau das, was ich mir vorstelle. -- Prince Kassad 21:29, 15. Sep. 2007 (CEST)
Nachtrag: ein vorläufiger Anfang ist unter Benutzer:Prince Kassad/Wikipedia:WikiProjekt Unicode zu finden. -- Prince Kassad 21:48, 15. Sep. 2007 (CEST)
Einverstanden. --Reiner Stoppok 22:15, 15. Sep. 2007 (CEST) PS: Und wann ist die Eröffnungsfeier?
Die Eröffnungsfeier ist, sobald die Seite fertig ist. Das wird aber wahrscheinlich nicht mehr lange dauern. -- Prince Kassad 22:18, 15. Sep. 2007 (CEST)
Es müssten noch mehr Tipps aus der Arbeitserfahrung rein, ich z.B. finde http://www.fileformat.info/info/unicode/char/search.htm sehr nützlich, auch die Hinweise auf die frz. Übersetzung, der Hinweis auf die (nur bedingt verwendbare) Zeichentabelle von Microsoft (z.B. bei Arial Unicode MS) usw. Sollen wir das einfach alles auf die Probeseite bei Dir reinschreiben? --Reiner Stoppok 22:26, 15. Sep. 2007 (CEST) PS: Ich hab da nicht so den Überblick: hast Du bestimmte Projektseiten als Vorbild?
Die Seite ist jetzt im WP-Namensraum, schreibe dort erstmal alles rein, ich kümmere mich um den Rest. (und trage dich als Mitarbeiter ein, wenn du schon dabei bist) -- Prince Kassad 22:27, 15. Sep. 2007 (CEST)
Willkommen beim Wikipedia:WikiProjekt Unicode.

Verschiebung der Seite Liste von Unicode-Zeichen nach Vollständige Liste der Unicode-Zeichen

Warum nicht einfach diese Liste nach dort verschieben? --Reiner Stoppok 16:33, 16. Sep. 2007 (CEST)

Jetzt ist es zu spät, jetzt können wir die Liste nicht mehr verschieben. -- Prince Kassad 16:35, 16. Sep. 2007 (CEST)
Wieso zu spät? Die ist doch viel vollständiger. Ausserdem würde ich den Namen Liste der Unicode-Zeichen bevorzugen, da steckt die Vollständigkeit ja auch schon im Namen drin. --Reiner Stoppok 16:40, 16. Sep. 2007 (CEST)
Wir brauchen die Liste noch als Quelle, es ist daher besser, vorerst alles zu belassen. Was danach passiert, können wir dann besprechen. -- Prince Kassad 16:59, 16. Sep. 2007 (CEST)
Ich lehne den Namen Vollständige Liste der Unicode-Zeichen ab, weil Personenen, die die Liste anklicken, auch das erwarten, was ihnen der Titel versprochen hat. Da wäre die Enttäuschung bei "Liste der Unicode-Zeichen" zumindest nicht ganz so groß. --Reiner Stoppok 17:55, 16. Sep. 2007 (CEST)

Lieber Reiner, auch ich bin dafür, nachher einiges zu verschieben und zusammenzulegen; im Moment hatte ich den Namen "Vollständige..." gewählt, weil die Liste von Unicode-Zeichen ja schon existierte und ich die neue Seite davon abgrenzen wollte; abgesehen davon macht der Ausdruck "vollständig" die Leser vielleicht ein wenig darauf aufmerksam, was sie da für ein Seiten-Monstrum erwartet. Mittelfristig, also nach der Auslagerung aller bereits in der Liste von Unicode-Zeichen enthaltenen Informationen in Einzelseiten, wäre eine Umbenennung in Liste der Unicode-Zeichen aber in der Tat sinnvoll, und dann könnte man die Seite Liste von Unicode-Zeichen tatsächlich löschen (oder besser: daraus eine Weiterleitung machen, damit die Historie sichtbar bleibt). Aber zunächst einmal würde ich empfehlen, die alte Seite zu "leeren", indem die Informationen weiter ausgelagert werden. --Daniel Bunčić 20:52, 16. Sep. 2007 (CEST)

Ok. Ich hab nämlich ne Mogelpackungsallergie ... --Reiner Stoppok 21:20, 16. Sep. 2007 (CEST) PS: Oben hatte ich (Dir) bei "Diskussion:Liste von Unicode-Zeichen#Bezeichnungen ohne diakritische Zeichen" noch was geschrieben.

Namen für diakritische Zeichen

Ich habe mal den Unicode-Block Kombinierende diakritische Zeichen vervollständigt; meine Vorschläge für deutsche Beschreibungen stehen damit zur allgemeinen Diskussion, und das Ergebnis der Diskussion könnte dann die Grundlage für die Beschreibungen anderer Zeichen, in denen diese Diakritika vorkommen, werden. --Daniel Bunčić 14:17, 17. Sep. 2007 (CEST)

Heissen die nicht schon "Verbindungszeichen"? (z.B. [2]) oder "Kombinationszeichen" ([3]) --Reiner Stoppok 14:47, 17. Sep. 2007 (CEST) PS: Und wird nicht in der "OFFIZIELLEN BEZEICHUNG" alles groß geschrieben? - "Cédille" würde ich Cedille schreiben: keine Sonderzeichen verwenden! - Noch ne Frage: Sollte man für das "v" lieber Kombinierender lateinischer Kleinbuchstabe v oder Kombinierender lateinischer Kleinbuchstabe V (d.h. den Buchstaben groß) schreiben? Das "klein" steckt ja schon im Namen ... (was sagt da der Duden?)
  • Verbindungszeichen und Kombinationszeichen kannte ich nicht (und das, obwohl ich gerade an Diakritika-Artikeln für ein linguistisches Wörterbuch schreibe; in der Sprachwissenschaft sind mir diese Ausdrücke noch nicht untergekommen). Vor allem Kombinationszeichen klingt sehr logisch, vielleicht sollte man das nehmen.
  • Die Versalschreibung der englischen Originale kann man gern wieder einführen, dann sollte man diese Bezeichnungen aber kleiner schreiben, sonst wirkt das so schrecklich anschreiend. Ich dachte, die Anfangsbuchstaben jedes Wortes großzuschreiben würde vielleicht auch reichen.
  • Ich habe ja keine Diakritika-Allergie und finde, dass in fremden Fachwörtern und Namen Diakritika zur korrekten deutschen Schreibung dazugehören. Übrigens landet man, wenn man Cedille eingibt, per Weiterleitung bei Cédille. Wenn Ihr also unbedingt auf den Akut verzichten wollt, müsst Ihr [[Cédille|Cedille]] schreiben.
  • Der Duden sagt: "Wie Substantive gebrauchte einzelne Buchstaben schreibt man üblicherweise groß. Meint man aber den Kleinbuchstaben, wie er im Schriftbild vorkommt, schreibt man meist klein." (22. Aufl., S. 58, K 97) Die Amtliche Regelung äußert sich dazu direkt zwar nicht, setzt aber die Priorität des Schriftbildes voraus, wenn sie in § 55 Abs. 1–2 einerseits i-Punkt und andererseits T-förmig anführt, wo die Groß-/Kleinschreibung sich nicht nach der Wortart zu richten hat, sondern es wichtiger ist, dass ja schließlich das große I keinen Punkt hat bzw. nicht die Form eines kleinen t gemeint ist. Dass im englischen Original überall nur Großbuchstaben stehen, liegt ja bloß an der Versalschreibung.
--Daniel Bunčić 21:18, 17. Sep. 2007 (CEST)
  • "Kombinierende diakritische Zeichen" gefällt mir persönlich am besten, obwohl es sich nicht bei allen Zeichem un diakritische Zeichen im herkömmlichen Sinn handelt. Wichtig finde ich das "kombinierend", da es die Eigenschaft des Zeichen, mit dem vorhergehenden Zeichen eine auf der Ebene des Benutzers untrennbare Verbindung einzugehen, am besten beschreibt.
  • Durchgehende Großschreibung der Originalbezeichnungen plus Verkleinerung der Schrift finde ich eine gute Idee!
  • In Wörtern braucht auf die üblichen Sonderzeichen nicht verzichtet zu werden. Deshalb finde ich Cédille völlig in Ordnung. Nur bei Buchstabennamen sollte unbedingt darauf verzichtet werden, wie ich unter Bezeichnungen ohne diakritische Zeichen ausgeführt habe.
  • Zur Frage der Groß- und Kleinschreibung habe ich unten einen separaten Abschnitt eröffnet.
Gismatis 08:43, 18. Sep. 2007 (CEST)
Wie wärs mit "Diakritische Kombinationszeichen" (ein Wort weniger)? --Reiner Stoppok 15:15, 18. Sep. 2007 (CEST)
Der Einspareffekt wäre minimal. Und "Kombinationszeichen" gefällt mir nicht, weil es weniger aussagt als "kombinierendes Zeichen". Gismatis 00:05, 19. Sep. 2007 (CEST)
Ok. --Reiner Stoppok 14:15, 19. Sep. 2007 (CEST)

Reihenfolge

Wäre es nicht logischer, erst die deutsche, dann die englische Beschreibung anzuführen? -- Prince Kassad 15:36, 17. Sep. 2007 (CEST)

Ja. --Reiner Stoppok 15:41, 17. Sep. 2007 (CEST)

Dezimalzahlen

Lieber Prince Kassad, was heißt denn hier, "Dezimalzahlen sind nicht offiziell"? Dass sie nicht in den Tabellen des Unicode-Konsortiums stehen ist m. E. pure Anwenderunfreundlichkeit. Der Computer jedenfalls verwendet definitiv Binärzahlen – sollen wir dann lieber die angeben? Ich hatte die Dezimalzahlen (zusätzlich zu den Hexadezimalzahlen, und zwar in Klammern!) lediglich als Service für die Wikipedia-Leser gemeint, die vielleicht doch eher mit Dezimal- als mit Hexadezimalzahlen zu zählen und rechnen gewohnt sind. Abgesehen davon kann man z. B. auf HTML-Seiten &#427; eingeben und erhält dann ƫ (= U+01AB). Warum sollte man also die Dezimalzahlen nicht angeben? --Daniel Bunčić 21:31, 17. Sep. 2007 (CEST)

  1. Man kann HTML-Notationen auch als &#x1AB; (Ergebnis: ƫ) angeben, dann erspart man sich das Umwandeln.
  2. Wenn man umwandeln muss, kann man auch einen Taschenrechner benutzen.
Daher finde ich, dass es unnötig ist, die Zahl in mehreren Zahlensystemen anzugeben. -- Prince Kassad 21:35, 17. Sep. 2007 (CEST)

Ich habe einfach das Gefühl, dass gerade die Leute, für die wir extra eine deutsche Unicode-Übersetzung in die Wikipedia tippen, stets mit der wohlfeilen Begründung, es könnten ja nicht alle gut Englisch, eine "Übersetzung" der seltsamen Zahlen-Buchstaben-Ungetüme in "normale" Zahlen nicht rundheraus ablehnen würden. Ich schätze mal, dass die Menge der Menschen, die zwar kein Englisch, dafür aber Hexadezimalisch können, sehr klein ist. --Daniel Bunčić 21:50, 17. Sep. 2007 (CEST)

Mal so als Frage: wie stellst du dir die Dezimalsache mit den Ideographen Erweiterung B vor? Bei dieser Tabellenform ist es nicht ganz einfach. -- Prince Kassad 22:01, 17. Sep. 2007 (CEST)

Es ist ja nicht mehr als ein Service an den Stellen, wo es einfach zu bewerkstelligen ist (nämlich z. B. durch mein unten erwähntes Makro). Wer die ganzen chinesischen Zeichen lesen kann und ohne eine (englische oder deutsche) Erklärung auskommt, kann sicherlich auch das Fehlen einer Dezimalzahl verschmerzen.
Nebenbei: Sollen die Ideographen Erweiterung B und andere Mammutlisten denn auch in die "Vollständige Liste" eingebaut werden? Oder machen wir vielleicht zwei Seiten, eine mit und eine ohne CJK? --Daniel Bunčić 22:07, 17. Sep. 2007 (CEST)

Unter einer vollständigen Liste erwarte ich auch eine vollständige Liste, also würde ich sagen, da kommen alle Blöcke rein. -- Prince Kassad 22:10, 17. Sep. 2007 (CEST)
Schön. Ich habe gerade überlegt, ob man mit dem Ein-/Ausklappmechanismus, den es für Navigationsleisten gibt, etwas anfangen kann. Hier steht, wie man diesen Mechanismus auch für andere Inhalte verwenden kann. Allerdings wird der Quelltext einer Seite dadurch nicht kürzer. Die Frage wäre also: Hängen Browser sich auf beim bloßen Herunterladen einer ellenlangen Seite (glaube ich eher nicht) oder beim Versuch, so massenhafte verschiedene Zeichen auf einer Seite darzustellen (vermute ich eher)? Im letzteren Fall könnte man mit dem Einklappmechanismus wohl etwas anfangen... --Daniel Bunčić 22:20, 17. Sep. 2007 (CEST)
Ich würde mal tippen, es ist der Versuch, die Zeichen anzuzeigen, was auch recht logisch klingt. Falls es möglich ist, den Mechanismus irgendwie dort einzubauen, und das auch Prozessorlaufzeitersparnis bringt, ist es das wert. -- Prince Kassad 22:29, 17. Sep. 2007 (CEST)
Beim Internet-Explorer hat es ein paar Versionen länger gedauert, bis neben &#256; auch &#x100; unterstützt wurde. Deshalb ist es vorteilhaft in HTML-Dateien die schon immer vorhandene dezimale Schreibweise zu verwenden. Deshalb ist die bei mir drin. -- Rainer Seitel

Die Angabe der laufenden Nummer (d.h. die Sache mit den Zahlenangaben in den Klammern) finde ich gut. Diese Reihenfolge wird sich ja wohl auch nicht (zu unseren Lebzeiten) ändern. --Reiner Stoppok 15:33, 18. Sep. 2007 (CEST)

Weiteres Vorgehen

Lieber Prince Kassad, lieber Reiner Stoppok,
heute habe ich mir in Word einen kleinen Makro gebastelt, mit dem ich rasend schnell WikiTabellen mit Unicode-Zeichen und Nummern erzeugen kann (ich muss nur Anfangs- und Endnummer eingeben, der Rest passiert von selbst). Was natürlich fehlt, sind die offiziellen Zeichennamen (und die deutschen Übersetzungen sowieso). Würde es Euch helfen, wenn ich einfach die noch gar nicht angefangenen Unicode-Blöcke als "Stubs" erzeugen würde, also fertige Tabellen, in die die Buchstabennamen noch eingetragen werden müssen? Ich könnte mir vorstellen, dass das händische Eintippen der ganzen Sonderzeichen auch einiges an Arbeit erfordert, die ich uns mit diesem kleinen Hilfsmittel ersparen könnte. Oder weiß jemand, wo man die englischen Originalnamen möglichst "nackt" als Liste erhalten kann? Dann könnte ich sie in meinen Makro vielleicht auch direkt einbauen, so dass dann auf den "Stub"-Seiten jeweils nur noch die deutsche Beschreibung fehlen würde. --Daniel Bunčić 22:01, 17. Sep. 2007 (CEST)

Das ganze Tabellenerstellen macht schon Arbeit. Die Frage ist, ob die Stubs ohne Bezeichnungen sich nicht einen LA einfangen werden, und wie das mit den reservierten Feldern gemacht wird. Außerdem gibt es einige Unicode-Bereiche, die keine Bezeichnungen benötigen, sondern einfach als 16-Spalten-Tabelle dargestellt werden können, die müsste man auch berücksichtigen. Falls nichts klappt, gäbe es da noch den Benutzernamensraum. -- Prince Kassad 22:09, 17. Sep. 2007 (CEST)

Benutzernamensraum! Ja doch, an den denke ich immer viel zu wenig. Dann werde ich in den nächsten Tagen einfach mal hier weitermachen und einige der fetten roten Links blau machen. Aber wenn einer von Euch vielleicht doch noch weiß, wo man eine Liste der Originalnamen herbekommen kann, wäre ich natürlich dankbar. --Daniel Bunčić 23:05, 17. Sep. 2007 (CEST)

[4], textdatei, wurde von 91.55.86.151 19:41, 6. Sep. 2007 (CEST) in der Löschdisk genannt.. (die blockschrift ist übrigens meines wissen bestandteil der norm..) gruß -- W!B: 23:46, 17. Sep. 2007 (CEST)
die lizenz lautet übrigens:

„Any person is hereby authorized, without fee, to modify such documents and files to create derivative works conforming to the Unicode® Standard, subject to Terms and Conditions herein.“

„Copyright © 1991-2007 Unicode, Inc. All rights reserved. Distributed under the Terms of Use in http://www.unicode.org/copyright.html.“

„Permission is hereby granted, free of charge, to any person obtaining a copy of the Unicode data files […] without restriction, including without limitation the rights to use, copy, modify, merge, publish, distribute, and/or sell copies of the Data Files or Software, and to permit persons to whom the Data Files or Software are furnished to do so, provided that (a) the above copyright notice(s) and this permission notice appear with all copies of the Data Files or Software, (b) both the above copyright notice(s) and this permission notice appear in associated documentation, and (c) there is clear notice in each modified Data File or in the Software as well as in the documentation associated with the Data File(s) or Software that the data or software has been modified.“

- hört sich schlecht an, das dann unter GNU zu stellen, vielleicht unserer UR-abteilung vorlegen, zur sicherheit - alternative ist abtippsen oder unicode.org um erlaubnis bitten -- W!B: 23:58, 17. Sep. 2007 (CEST)

Vielen, vielen Dank, W!B, ich habe meinen Makro mithilfe dieser Liste verbessert, und das Ergebnis könnt Ihr nun unter Benutzer:Buncic/Unicode ansehen. Im Prinzip fehlt nur jeweils am Anfang, wo ich "???" gesetzt habe, ein Schluss des Einleitungssatzes (so etwas wie "enthält alle Zeichen der Soundso-Schrift." würde schon reichen), dann könnte man diese Seiten auch vielleicht auch schon in die Wikipedia stellen, nur ist halt noch keine deutsche Beschreibung vorhanden.
Die Lizenz klingt für mich eigentlich gar nicht so schlecht, da ich ja nur die Namen benutzt habe, die Veränderung der Datei ausdrücklich erlaubt ist und am Ende jedes so entstandenen Blocks ein Link auf die Seiten des Unicode-Konsortiums vorhanden ist. --Daniel Bunčić 11:16, 18. Sep. 2007 (CEST)
So, die Blöcke, die noch komplett fehlten, sind jetzt fertig. Jetzt arbeite ich daran, die bereits fertigen deutschen Beschreibungen in meinen Makro einzulesen, um die anderen Blöcke mit den schönen groß-klein-geschriebenen Originalnamen zu versehen. --Daniel Bunčić 14:02, 18. Sep. 2007 (CEST)
Leider habe ich im Moment keine Zeit mehr, aber die in der deutschen oder englischen Wikipedia bereits existierenden Blöcke würde ich vorschlagen, jetzt nicht mit großem Aufwand an das neue Format anzugleichen, da mein Makro inzwischen sowohl die englischen als auch die deutschen Bezeichnungen (mit dem Stand von heute) intus hat, so dass ich diese Dinge sehr viel einfacher mit dem Makro erledigen könnte. Ich würde also vorschlagen, dass diejenigen, die im Moment etwas arbeiten möchten, zunächst nur die auf Benutzer:Buncic/Unicode bereits blauen Tabellen zu vernünftigen Unicode-Block-Seiten machen. Alles, was dort bisher rot ist, werde ich in der nächsten Zeit zunächst noch durch meinen Makro jagen. --Daniel Bunčić 16:15, 18. Sep. 2007 (CEST)
So, jetzt sind alle Links auf der Seite Benutzer:Buncic/Unicode blau, das heißt, alle Tabellen sind vorhanden. Man muss jetzt nur noch die überflüssigen Tabellenzeilen löschen, einen Einleitungssatz schreiben und, wo sie noch fehlen, die deutschen Bezeichnungen hinzufügen. Ich würde aber vorschlagen, dass wir uns (abgesehen von "Arabisch", "Syrisch" und "Arabisch, Ergänzung", die weit vorn stehen und wichtig sind) vorrangig um die bereits übersetzten Blöcke kümmern, um die Seite Liste von Unicode-Zeichen bald in eine Weiterleitung umwandeln zu können. --Daniel Bunčić 13:30, 19. Sep. 2007 (CEST)
Jetzt habe ich alles, was die Seite Liste von Unicode-Zeichen noch an Text enthielt, in die Seiten unter Benutzer:Buncic/Unicode kopiert, so dass man in Erstere gar nicht mehr hineingucken muss, sondern nur noch in Letztere. --Daniel Bunčić 14:05, 19. Sep. 2007 (CEST)
Alle auf der alten Seite vorhandenen Blöcke sind jetzt integriert. Aber es gibt unter Benutzer:Buncic/Unicode natürlich trotzdem noch viel zu tun, es fehlen noch viele wichtige Blöcke. --Daniel Bunčić 13:19, 27. Sep. 2007 (CEST)

Groß- und Kleinschreibung

Da die Frage der Groß- und Kleinschreibung gerade aktuell ist, eröffne ich jetzt mal diesen Abschnitt, um diese Frage an zentraler Stelle zu besprechen.

Die Kleinschreibung von Buchstabennamen (Lateinischer Kleinbuchstabe x) wie sie zum Beispiel von Daniel Bunčić vertreten wird, will mit nicht so recht gefallen.

Im Duden heißt es auf Seite 68 der 24. Auflage: "Wie Substantive gebrauchte Buchstaben schreibt man üblicherweise groß. Meint man aber den Kleinbuchstaben, wie er im Schriftbild vorkommt, schreibt man meist klein." Diese Erläuterung (keine Regel!) bietet Raum für Interpretationen. Exakt den Fall, mit dem wir es hier zu tun haben, beschreibt der Duden nicht. Die amtliche Regelung schreibt unter § 55, Absatz 1: "Abkürzungen sowie zitierte Wortformen und Einzelbuchstaben und dergleichen bleiben allerdings unverändert, zum Beispiel: die km-Zahl, die pH-Wert-Bestimmmung, der dass-Satz, die x-Achse, der i-Punkit (der Punkt auf dem kleinen i)"

Folgende Gründe sprechen meiner Meinung nach für die Großschreibung:

  • Die Buchstaben in den Beschreibungen haben klar den Charakter von Namen. Man muss streng unterscheiden zwischen dem Zeichen selbst und der Beschreibung. Obige Regel kann meinem Verständnis nach nicht dahingehend zur Anwendung kommen, dass das Unicode-Zeichen in der Beschreibung quasi zitiert wird, sondern die Beschreibung bildet eine autonome Einheit. Kleinschreibung wäre nur sinnvoll, wenn man eigentlich das Unicode-Zeichen selbst meint, und "Lateinischer Kleinbuchstabe" wäre nur ein fakultativer Zusatz. So könnte man dann mit allen Unicode-Zeichen verfahren. Griechisches Gegenstück zu "Lateinischer Kleinbuchstabe g" etwa wäre dann "Griechischer Kleinbuchstabe γ". Das Gegenstück zu "Griechischer Kleinbuchstabe Gamma" wäre hingegen "Lateinischer Kleinbuchstabe G".
  • Analogie mit ausgeschriebenen Buchstabennamen: Ausgeschriebene Buchstabennamen wie beim griechischen Alphabeit werden immer großgeschrieben. So kann α nur Griechischer Buchstabe Alpha (nicht alpha!) heißen.
  • Es sieht besser aus (finde ich)

Vielleicht wird sich der eine oder andere wundern, weshalb ich nicht das Argument mit der Redundanz gebracht habe, schließlich steckt der Kleinbuchstabe schon in der Bezeichnung. Wie ich beim ersten Punkt argumentiert habe, halte ich die Konstruktion "Lateinischer Kleinbuchstabe a" für durchaus gerechtfertigt, wenn man folgendes ausdrücken möchte: "Lateinischer Kleinbuchstabe: a" in einer Tabelle mit beispielsweise "Bopomofo-Buchstabe: ㄅ". Gismatis 08:35, 18. Sep. 2007 (CEST)

Wenn a, b, c usw. wirklich Namen wären, hättest Du Recht. Sind es aber nicht, besonders deutlich zu sehen beim lateinischen Kleinbuchstaben y, dessen Name Ypsilon ist und eben nicht Y. --Daniel Bunčić 11:19, 18. Sep. 2007 (CEST)
Lieber Daniel Bunčić, wir müssen hier zu einer GROSSEN Übereinkunft kommen. Deshalb: "Think BIG!" --Reiner Stoppok 16:12, 18. Sep. 2007 (CEST)
Mein Duden:
  • Y (Buchstabe); das Y; des Y, die Y, ...
  • Ypsilon, vgl. Y (Buchstabe)
Und so ist es doch. Der Name des lateinischen Buchstabens wird selten ausgeschrieben. Der Name des Buchstabens ist also durchaus Y. Wer Ypsilon schreibt, meint in der Regel den griechischen Buchstaben, dessen Name ja tatsächlich Ypsilon ist. Gibt es noch etwas anderes, das dagegen spricht, dass es sich bei den Buchstaben um Namen handelt? Was soll es sonst sein, besonders bei den kyrillischen Buchstaben? Gismatis 00:14, 19. Sep. 2007 (CEST)
Lieber Gismatis, wir ziehen doch alle an einem Strang, da haben wir es doch nicht nötig, beim Zitieren entstellende Auslassungen zu machen. An der Stelle, wo Du „...“ schreibst, geht es im Duden (1967, 1996, 2001, 2006) weiter: „aber das y in [1967: Mayen,] Doyen; der Buchstabe Y, y“. Man schreibt also (nach alter wie neuer Rechtschreibung) klein, wenn man den Kleinbuchstaben meint, da ist der Duden ganz eindeutig.
Bei den kyrillischen Buchstaben wird im englischen Original in der Tat so etwas Ähnliches wie Namen benutzt, nämlich die russischen Buchstabiernamen (die sich von den ukrainischen, weißrussischen, serbischen und bulgarischen unterscheiden!). Wenn man also tatsächlich dieses schreckliche A, Bäh, Wäh, Gäh, Däh übernehmen will, dann könnte man hier die Großschreibung rechtfertigen. Aber nicht bei den lateinischen Buchstaben a, b, c, d, e, sonst müsste man auch hier A, Beh, Ceh, Deh, Eh o. Ä. schreiben.
Ich weiß ja nicht, warum das Unicode-Konsortium für die kyrillischen Buchstaben nicht die traditionellen Namen genommen hat, die wären übernational gewesen. Wahrscheinlich saßen da Exilrussen im Konsortium... --Daniel Bunčić 09:06, 19. Sep. 2007 (CEST)
Lieber Daniel Bunčić! Wir haben es aber bei unseren Benennungen quasi mit Lemmaüberschriften zu tun. Und alle Buchstaben-Lemmata meines (Uralt-)Dudens (1973) werden nun einmal groß geschrieben. --Reiner Stoppok 13:58, 19. Sep. 2007 (CEST)
Am Anfang eines Artikels schreibt man natürlich groß. Aber ich sehe nicht, inwiefern das "b" in "Lateinischer Kleinbuchstabe b" am Anfang einer Lemmaüberschrift stehen soll. --Daniel Bunčić 14:02, 19. Sep. 2007 (CEST)
Mein Duden hat aber auch ziemlich viele klein geschriebene Artikel(überschriften), halt nur nicht zu den Buchstaben ... --Reiner Stoppok 14:50, 19. Sep. 2007 (CEST)
Wir haben es hier aber nicht wie der Duden nur mit einem einzigen Alphabet zu tun. Deshalb müssen wir (bekanntlich) erst einmal präzisieren, in welche Großschublade das Zeichen gehört (hier:"Lateinischer Kleinbuchstabe"), und wenn wir uns das dann wieder wegdenken (!), landen wir beim eigentlichen Lemma. Und da ist dann m.E. die Großschreibung besser. --Reiner Stoppok 14:42, 19. Sep. 2007 (CEST)
Also da muss ich mich jetzt aber entschieden wehren! Mit meinem Duden-Zitat wollte ich nur darauf hinweisen, dass der Buchstabe Y normalerweise nicht "Ypsilon" geschrieben wird. Der Rest des Eintrages hatte damit nichts mehr zu tun und wurde von mir deshalb nicht mehr zitiert. Ich habe es ganz bestimmt nicht nötig, und es ist auch nicht meine Art, irgendwelche Auslassungen zu machen!
Vergiss doch "A", "Beh", "Ceh" usw. beim lateinischen Alphabet, das schreibt niemand! A, B, C usw. ist bereits die Schreibweise für die gesprochenen Buchstabennamen. Ich wiederhole: Es gibt eigentlich drei Fälle. 1. Der Buchstabe y (Kleinbuchstabe) 2. Der Buchstabe Y (Großbuchstabe) 3. Der Buchstabe Y (25. Buchstabe des lateinischen Alphabets). Du siehst, "Der Buchstabe Y" hat eigentlich zwei Bedeutungen, welche aber gleich geschrieben werden. Unsere Meinungsverschiedenheit rührt daher, dass du der Verwendung 1 und 2 den Vorzug gibst, und ich der Verwendung 3. Kurz: Du meinst das Zeichen und ich den Namen. Beides ist dudenkonform.
Nun zu den kyrillischen Buchstaben: ich weiß jetzt, warum Unicode die russischen Buchstabiernamen ausschreibt: weil es den kyrillischen Buchstaben G einfach nicht gibt! Erst recht gibt es keinen kyrillischen Kleinbuchstaben g. Es war also nur folgerichtig vom Unicode-Konsortium für die Beschreibung von nichtlateinischen Schriften, ausgeschriebene Namen zu verwenden. Warum es bei den kyrillischen Namen die russischen Buchstabiernamen gewählt haben, braucht uns dabei nicht zu kümmern.
Was die lateinischen Buchstaben betrifft, so bleibt festzuhalten: Ich halte beide Vatianten grundsätzlich für möglich, halte die Großschreibung aber für angebrachter und habe das ausführlich begründet.
Bei den kyrillischen Buchstaben hingegen habe ich dargelegt, warum wir den einzelnen lateinischen Buchstaben nicht verwenden können. Auch die Transliteration bietet keinen Ausweg, weil sie nicht dazu da ist, kyrillische Buchstaben in einem unicodebasierten Text zu ersetzen. Wir kommen also nicht umhin, bei den kyrillischen Buchstaben echte Namen zu verwenden, also Be, Ge, Schtscha usw. Und gerade weil du diese Namen so schrecklich findest, musst du besonders kritisch sein, was deine Beurteilung betrifft. Du wirst verstehen, dass deine bloße gefühlsmäßige Ablehnung keine Rolle spielen darf. Ich jedenfalls, der die Buchstabiernamen weder schrecklich noch schön findet, empfehle deren Verwendung.
Ich hoffe, dass wir bald zu einer Übereinkunft kommen. Hilfreich wäre es auch, wenn sich alle anderen zu dieser Frage äußern würden. Dann könnte sich wenn nicht ein Konsens doch zumindest eine Mehrheit für eine bestimmte Variante herausbilden. Gismatis 00:01, 24. Sep. 2007 (CEST)
Gut, dass Du die Sache mit dem Zitat klargestellt hast. Es steht einfach unter der Überschrift "Groß- und Kleinschreibung", da durfte ich doch wohl denken, dass es immer noch darum geht.
Deine drei Fälle sind vollkommen richtig. Du hast nur vergessen, dass statt Buchstabe auch Großbuchstabe oder Kleinbuchstabe davorstehen kann. Und da ist der Duden absolut eindeutig: der Großbuchstbabe a ist ebenso falsch wie der Kleinbuchstabe A.
Warum soll es den kyrillischen Buchstaben G nicht geben? Die Transkription ist doch dazu erfunden worden, kyrillische Buchstaben mit lateinischen wiederzugeben. So argumentiert, gäbe es auch keinen kyrillischen Buchstaben Ge, denn auch der Name ist ja im Original гэ und nicht Ge.
Dass ich die Namen so schrecklich finde, ist nicht gefühlsbasiert. Sie sind erstens russozentrisch, weil alle anderen Völker, die die kyrillische Schrift benutzen, diese Buchstaben anders nennen. Und zweitens sind sie eurozentrisch (oder amizentrisch oder was immer), weil wir uns selbst Buchstabennamen, die keine sind, wie Ah, Beh, Ceh, Deh niemals zumuten würden, aber bei den anderen kann man es ja machen.
Wenn Ihr der Meinung seid, dass man das englische Original wortwörtlich übersetzen muss (wozu?), können wir das ja gern machen und dann zur Klarheit in Klammern den transliterierten Buchstaben angeben. Wäre das ein Kompromiss? --Daniel Bunčić 08:26, 24. Sep. 2007 (CEST)
Was wir hier tun, ist ja auch für echte Sprecher der deutschen Sprache gedacht. Und nur für die. Und bei einem solchen germanozentrischen Treiben sollten daher "echte Namen" verwendt werden dürfen. Wir wollen hier doch nicht die Terminologien der Transkription und Transliteration der Sprachen und Schriften der indigenen Völker des Nordens, Sibiriens und des Russischen Fernen Ostens aus der "Gemeinschaft unaussprechlicher Staaten" (GUS) ausdiskutieren, sondern lediglich etwas sinnvoll benamsen. Und irgendwie scheinen mir da - nach reiflicher Überlegung - die russischen Benennungen näher zu stehen.
Und wenn wir der Großschreibung generell den Vorzug geben würden (wie wäre es mit einem Schrieb an den Duden?!), könnten wir uns endlich voll und ganz auf die Benennungsfragen konzentrieren. --Reiner Stoppok 15:06, 24. Sep. 2007 (CEST)
Das meinst Du doch nicht ernst? Du willst den Duden bitten, Deine Privatrechtschreibung für die Wikipedia zu sanktionieren?
Aber бэ, вэ, гэ, дэ usw. sind eben keine echten Namen, die wirst Du genauso erfolglos im Lexikon suchen wie beh, ceh, deh usw. im Duden – im Gegensatz zu мягкий знак, твердый знак und и краткое, die stehen ebenso drin wie Ypsilon und Zett.
Wie wäre es, wenn wir diese Frage erst einmal hintan stellen würden und Du vorläufig Deine Zeit darauf verwenden würdest, Prince Kassad und mir zu helfen, die unter Benutzer:Buncic/Unicode aufgelisteten Seiten in Wikipedia-Artikel umzuwandeln? --Daniel Bunčić 15:43, 24. Sep. 2007 (CEST)
Und ich wollte Dich darauf aufmerksam machen, dass es möglich wäre, uns Deine Auffassung der Rechtschreibregeln "offiziell" durch die Duden-Redaktion bestätigen zu lassen, da wir sie anscheinend anders auslegen. Es geht bei den Benennungen auch um Artikelüberschriften, und nicht um Texte. --Reiner Stoppok 18:10, 24. Sep. 2007 (CEST)
Deine Trennung in "echte" und "nicht echte" Namen halte ich für künstlich. Auch Buchstabiernamen sind Namen. Gismatis 02:41, 25. Sep. 2007 (CEST)
Ich fände es auch durchaus interessant, was die Duden-Redaktion dazu meint. Allerdings bezweifle ich, dass die sich bei einer Anfrage so eingehend mit dieser Frage auseinandersetzen werden wie wir. Aber ein Versuch wäre es vielleicht wert. Ich hoffe, du hast Verständnis dafür, dass ich jetzt in die Kleinschreibung eingelenkt habe (siehe weiter unten). Aber wir müssen einfach auch vorankommen. Ein großer Teil der Lateintabellen ist bereits so erfasst, und wir können nicht auch noch eine Antwort der Duden-Redaktion abwarten. Gismatis 02:41, 25. Sep. 2007 (CEST) PS: Was hältst du von Daniels und meinem Kompromis-Vorschlag bezüglich des Kyrillischen?
Ich beziehe mich immer auf einen vorangegangenen Beitrag, egal wie die Überschrift lautet. Aber egal, das ist ja geklärt.
Die Eindeutigkeit, die du im Duden erkennen willst, kann ich nicht feststellen. Ich bin nach wie vor der Meinung, dass beide Varianten richtig sind, je nach Interpretation. Aber bevor wir noch ewig so weiterdiskutieren: Ich erkläre mich mit der Kleinschreibung für einverstanden! Sie ist zwar nicht meine bevorzugte Variante, aber es gibt Wichtigeres. Vielleicht überschätze ich auch einfach die Namenskraft der lateinischen Buchstaben.
Es gibt keinen kyrillischen Buchstaben G, weil es kein kyrillisches Graphem G gibt. Von daher verstehe ich, warum das Unicode-Konsortium die Buchstabiernamen gewählt hat, wahrscheinlich eben genau aus diesem Grund. Die Umschrift, auch die Transliteration, ist meiner Meinung auf die Grapheme an sich nicht anwendbar, sondern stellen bloß einen Behelf dar für ganze Wörter. Zwar halte ich es durchaus für sinnvoll, mit den lateinischen Buchstaben die kyrillischen Buchstaben direkt zu bezeichnen. Ich bin mir aber nicht sicher, ob das nicht Theoriefindung wäre. Einen kyrillischen Buchstaben Ge hingegen kann es genauso geben, wie es einen griechischen Buchstaben Gamma (nicht Γάμμα!) gibt.
Interessanterweise werden bei Zhuyin Einzelbuchstaben verwendet, obwohl hier ja wirklich Buchstabiernamen Bo, Po, Mo, Fo usw. zur Verfügung gestanden hätten. Allerdings frage ich mich, ob hier auch nicht einfach eher die Laute gemeint sind.
Dein "A, Bäh, Wäh, Gäh, Däh ..." und ähnliche Kommentare ("Zumutung") sprechen halt auch für eine gefühlsmäßige Ablehnung. Aber zu deinen Kritikpunkten:
  • Russozentrismus: War es ein Verbrechen des Unicode-Konsortiums, dass sie die Buchstabiernamen aus der wichtigsten Sprache entlehnt haben? Immerhin ging von der russischen Sprache die Verbreitung des kyrillischen Alphabets aus. Neutralität ist ja gut, aber nicht um jeden Preis. Beim arabischen Alphabet verhält es sich übrigens ähnlich.
  • "Zumutung": Weswegen? Was ist so schlimm an diesen Buchstabiernamen? Wenn die Russen die Unicode-Berschreibungen ins Russische übersetzen wollen, können sie von mir aus auch gerne die englischen Buchstabiernamen verwenden. Und was wäre so schlimm an lateinischem A, Be, Ce usw.? Es gibt einfach keine Tradition, diese Namen auszuschreiben, obwohl sie manchmal nützlich wären, um zu verdeutlichen, dass eben nicht explizit der Großbuchstabe gemeint ist.
Deinen Kompromissvorschlag finde ich sehr gut! Ja, ich bin der Meinung, dass wir in erster Linie die Originalbezeichnung wiedergeben müssen, deshalb bestehe ich darauf, die Buchstabiernamen zu adaptieren. Aber unsere Übersetzungen bilden ja keine in Stein gemeißelten Einheiten. Erklärende Zusätze halte ich für eine gute Idee, obwohl ich anfangs dagegen war. Jetzt sehe ich aber, dass damit vieles vereinfacht wird. Man könnte damit sogar das Digraph-/Ligatur-Problem lösen!
Also:
  • Groß- und Kleinschreibung der lateinischen Buchstaben richtet sich nach dem lateinischen Unicode-Zeichen
  • Bei den kyrillischen Buchstaben adaptieren wir die Buchstabiernamen mit der Transliteration in Klammer
Einverstanden? Dann könnten wir die Tabellen wenigstens mal fertigstellen. Es bleibt immer noch die Möglichkeit innerhalb des Unicode-Projektes Diskussionen wie diese zu führen und die ultimativ richtigen Schreibweisen und Benennungen auszuarbeiten. Gismatis 02:41, 25. Sep. 2007 (CEST)
Schön, einverstanden.
Nur noch ein Hinweis: Dass die Russen das wichtigste kyrillisch schreibende Volk sind – klar. Nur wird allzu gern vergessen, dass sie nicht das einzige sind. Dass "von der russischen Sprache die Verbreitung des kyrillischen Alphabets [ausging]", stimmt aber nicht, seinen Ursprung hatte das kyrillische Alphabet im heutigen Bulgarien und wurde mit dem Kirchenslawischen verbreitet, zunächst in die heutigen Länder Makedonien, Serbien, Ukraine, Weißrussland, Russland und Rumänien, Jahrhunderte später dann auch in die Kolonien des russischen Imperiums.
Ich arbeite weiter an der Übertragung der alten Daten in die neue Struktur. --Daniel Bunčić 06:34, 25. Sep. 2007 (CEST)
Und sogar bis zu den Chinesen ...
Nun gut. Mein Standpunkt war bekanntlich immer, dass die Schreibungen im Grunde unwichtig sind ... --Reiner Stoppok 13:34, 25. Sep. 2007 (CEST) PS: Für die endgültige Klärung der Groß- oder Kleinschreibung in den Zeichenbenamsungen spielt es sicherlich eine Rolle, als was man sie betrachtet ...
Bitte ankreuzen:
a) Eigennamen
b) mehrteilige Namen
c) feste Verbindungen
d) substantivische Wortgruppen
e) fachsprachliche Bezeichnungen
f) Groß- bzw. Kleinbuchstaben X (gilt für A, a, B, b, C, c usw.) --Daniel Bunčić 10:41, 26. Sep. 2007 (CEST)
g) Substantive X (gilt für Alpha, Beta, Gamma usw.) --Daniel Bunčić 10:43, 26. Sep. 2007 (CEST)
Ich tendiere zur Kleinschreibung. -- Rainer Seitel
Auf jeden Fall sollten die Benennungen von der Groß- und Kleinschreibung unabhängig sein (wobei im Deutschen nur das ß ein Problem darstellt). Bitte auch an Leute denken, die nicht gut sehen können und über das gesprochene Wort zum Zeichen finden möchten. --Reiner Stoppok 14:48, 18. Sep. 2007 (CEST) PS: Ich tendiere zur Großschreibung (vgl. "das A und das O", "von A bis Z", "wer A sagt, muß auch B sagen"). - Bitte mehr Konzentration auf die Benennungen, die Schreibungen sind sekundär!

Fragen

Die Seite Vollständige Liste der Unicode-Zeichen ist, wie man an dem Hinweis ganz oben erkennen kann, noch in (im Moment sehr intensiver) Arbeit. Wenn diese Arbeit beendet ist, wird sie tatsächlich nahezu vollständig sein, und dann wird auch die Redundanz behoben werden. Welche Zeichen Dein Computer darstellen kann und welche nicht, liegt an Deinem Computer und an den Schriftarten, die auf ihm installiert sind. Grafiken findet man jeweils über die Weblinks am Ende jedes Unicode-Blocks. --Daniel Bunčić 13:58, 18. Sep. 2007 (CEST)

Äthiopisch-Zusatz

Es gibt anscheinend sowohl in der Navileiste als auch bei den automatisch generierten Tabellen zwei verschiedene Blöcke mit gleichem Namen. In Unicode sind das Ethiopic Supplement und Ethiopic Extended, beides wurde wohl zu "Äthiopisch, Zusatz" übersetzt, was problematisch ist. -- Prince Kassad 16:17, 18. Sep. 2007 (CEST)

Hoppla. Könntest Du meinen Fehler anhand der Liste der Unicode-Blöcke beheben? Ich komme gerade nicht dazu. Danke! --Daniel Bunčić 17:04, 18. Sep. 2007 (CEST)
Ich verbessere den Fehler sofort. Kurioserweise wurde der Fehler in der Liste der Unicode-Blöcke mit der englischen Übersetzung gemacht, daher kann ich die nicht als Quelle nehmen. -- Prince Kassad 17:08, 18. Sep. 2007 (CEST)

Riesige Blöcke

Den Einklapp-Mechanismus habe ich mal in Benutzer:Buncic/Unicode/Hangeul-Silbenzeichen einklappbar ausprobiert, allerdings scheint sich die Zeit, bis die Seite am Bildschirm erscheint, gegenüber Benutzer:Buncic/Unicode/Hangeul-Silbenzeichen kaum zu unterscheiden. Das hat also offenbar doch etwas mit der Ladezeit zu tun. Daher habe ich den Unicode-Block Vereinheitlichte CJK-Ideogramme, Erweiterung B mal versuchsweise so eingebunden, indem ich die Tabelle als "noinclude" definiert habe. Wäre es nicht eine sinnvolle Lösung, genau diejenigen Tabellen nicht direkt in die "Vollständige Liste" einzubinden, die keine Bezeichnungen bzw. Beschreibungen enthalten? --Daniel Bunčić 13:36, 19. Sep. 2007 (CEST)

Die Ladezeiten bleiben gleich, aber sobald die Seite fertiggeladen ist, ist der Browser bei der Navileistenversion total flüssig, während er bei der normalen Version langsam läuft. -- Prince Kassad 16:19, 19. Sep. 2007 (CEST)

engl. letter

Das englische Wort letter sollte zwar eigentlich (z. B. in sprachwissenschaftlichen Texten) nur ‘Buchstabe’ bedeuten, wird aber im Druckwesen auch für ‘Letter, Drucktype’ benutzt ([5]). Dementsprechend ist es auch gerechtfertigt, letter in den Originalbezeichnungen mit Zeichen zu übersetzen – insbesondere bei den indischen Schriften, die ja nun einmal Silbenzeichen und keine Buchstaben haben. Können wir uns darauf einigen? --Daniel Bunčić 14:27, 19. Sep. 2007 (CEST)

Das ist ja wohl selbstverständlich. Evtl. sollte man auch noch ein Glossar zu erzielten Übereinkünften anlegen, z.B. "below = untergesetzt". --Reiner Stoppok 14:34, 19. Sep. 2007 (CEST)
"Zeichen" benutze ich im Moment für Sachen, die weder Buchstabe, noch Vokalzeichen, noch sonstwas sind. Und "Lateinisches Zeichen A" hört sich etwas merkwürdig an. Für Buchstaben, die auch Buchstaben sind, kann ruhig "Buchstabe" bleiben, für Silbenzeichen wie das chinesische wird ebendieses in die Beschreibung eingefügt - die indischen Schriften sind ein Streitfall, wo man sich einigen müsste. -- Prince Kassad 16:15, 19. Sep. 2007 (CEST)
Bei den japanischen Hiragana- und Katakana-Zeichen würde ich das Anhängsel "Silbenzeichen" verwenden, bei den chinesischen Schriftzeichen dagegen nicht. --Reiner Stoppok 18:52, 19. Sep. 2007 (CEST) PS: Obwohl es welche sind ...
Nein, die chinesischen Schriftzeichen sind keine Silben-, sondern Wortzeichen, Logogramme, da sie ja nicht nur den Laut einer Silbe, sondern auch dessen Bedeutung repräsentieren, im Gegensatz zu den japanischen Kana. --Daniel Bunčić 19:51, 19. Sep. 2007 (CEST)
Quatsch. --Reiner Stoppok 23:14, 19. Sep. 2007 (CEST) Siehe z.B. John DeFrancis (1986 und 1989). - Für die Benennung ("Chinesisches Schriftzeichen") spielt das auch keine Rolle.
Kein Quatsch, siehe z. B. Geoffrey Sampson (Writing systems: A linguistic introduction, London 1985), Florian Coulmas (The writing systems of the world, Oxford 1989), Hartmut Günther (Schriftliche Sprache: Strukturen geschriebener Wörter und ihre Verarbeitung beim Lesen, Tübingen 1988). Aber solange es bei "Chinesisches Schriftzeichen" bleibt, ist spielt das in der Tat keine Rolle. --Daniel Bunčić 07:47, 20. Sep. 2007 (CEST)
Doch Quatsch. Die Masse machts hier nich. - Wen das interessiert, dem empfehle ich den Artikel von John DeFrancis und J. Marshall Unger: "Rejoinder to Geoffrey Sampson, 'Chinese script and the diversity of writing systems'" (Linguistics 32 (1994), 549-554) zusammen mit all dem davor (d.h. dem Beitrag von Sampson in derselben Zeitschrift). --Reiner Stoppok 13:14, 20. Sep. 2007 (CEST)
Das gehört zwar eigentlich nicht hierher, aber so ein „Quatsch“ lasse ich nicht gern auf mir sitzen.
Ich habe inzwischen in DeFrancis’ The Chinese language: Fact and fantasy (Honolulu 1984) gelesen (vielen Dank für den Tipp! ein sehr spannendes Buch!) und muss erstens sagen, dass ich seine Einschätzung, “‘Logographic,’ ‘lexigraphic,’ ‘morphemic,’ and ‘morphographic’ are good as far as they go, but they do not go far enough” (S. 88) als deutlich milder empfinde als Dein „Quatsch“. Zweitens ist DeFrancis offensichtlich ein hervorragender Kenner des Chinesischen, aber wenn er von “a morpheme, the smallest unit of meaning” (S. 72) schreibt, hat er offensichtlich einen grundlegenden Begriff der Sprachwissenschaft nicht verstanden, denn ein Morphem ist eben keine Einheit der Bedeutung (das wäre eher ein Semem), sondern die kleinste Einheit einer Sprache, die (lautliche) Form und Bedeutung kombiniert. Drittens verstehe ich nicht, warum es besser sein soll, Termini wie “morphosyllabogram” (ebd.) als allgemeine Bezeichnung der chinesischen Schriftzeichen zu benutzen, wenn doch nach seinen Angaben 46,6 % der Zeichen keine Rückschlüsse auf die Bedeutung zulassen (“no or obscure relationship”, S. 129) und insgesamt 36,0 % keine Rückschlüsse auf die Aussprache (“Purely Semantic Characters” + “no useful similarity in segmental phonemes”, ebd.). Dann ist doch das einzige, was man auf jeden Fall über alle chinesischen Schriftzeichen sagen kann, dass jedes von ihnen treffsicher genau ein Morphem repräsentiert. Dass manche Zeichen dem Leser einen Tipp geben, was dieses Morphem bedeutet, andere, wie es klingt, und wieder andere beides, ist ja richtig, ändert aber nichts daran, dass sie alle morphologische Informationen kodieren (anders als Buchstaben und Silbenzeichen, die zwar auch zufällig mal mit einem Morphem identisch sein können, aber niemals Homonyme unterscheiden). Und genau das bezeichnen die oben von mir zitierten Autoren als „Logographie“. --Daniel Bunčić 13:31, 20. Sep. 2007 (CEST)
Mich hatte die pauschalisierende Behauptung entsetzt, chinesische Schriftzeichen seien "Wortzeichen" ("Logogramme"). Die Sache ist anscheinend doch etwas komplizierter ... --Reiner Stoppok 13:40, 20. Sep. 2007 (CEST) PS: Siehe auch die Literaturangabe oben.

Umbenennung/Verschiebung

Nachdem gestern Abend noch jemand Änderungen an der alten Seite vorgenommen hat, erscheint es mir sinnvoller, die Verschiebung und Umbenennung jetzt schon durchzuführen, um weitere Doppel-Arbeit zu vermeiden. Die neue Seite enthält schon fast alles, was auf der alten Seite war (nur 13 Blöcke fehlen noch, die sind in den nächsten zwei-drei Tagen zu schaffen), und vieles Neue. Sie wird jetzt also unter Liste der Unicode-Zeichen zu finden sein, ebenso wie diese Diskussion. --Daniel Bunčić 09:02, 26. Sep. 2007 (CEST)

Dann sollte alles Doppelte schnellstmöglich auch gelöscht werden. --Reiner Stoppok 14:39, 26. Sep. 2007 (CEST) PS: Ein hübscher kleiner Nachtrag zur "Duden-Krise": dies versus das.

Senkrechter Strich

Der Senkrechte Strich "|" (AltGr+<) wird in der Tabelle nicht dargestellt. Das dürfte daran liegen, dass die Tabellen im Wikipedia mit dem | aufgebaut werden. Leider weiß ich nicht, wie man das umgehen kann. Mit dem Backslash "\" den senkrechten Strich zu Maskieren hat beispielsweise nicht funktioniert. Irgendwelche vorschläge? Jakov 20:37, 9. Okt. 2007 (CEST)

Danke für den Hinweis. Hab's behoben. Es gibt zwei Lösungensmöglichkeiten: &#x007C; (meine Wahl) oder <nowiki>|</nowiki>. Gismatis 22:44, 9. Okt. 2007 (CEST)

Übersetzung für monospace?

Der Begriff sticht mir öfters ins Auge, in der Form monospace A, usw. Monospace kenn ich eingedeutscht als Festbreitenschrift, aber festbreites A hört sich merkwürdig an. -- Prince Kassad 18:23, 16. Okt. 2007 (CEST)

"Festbreiten-A", "Festbreitenbuchstabe A" oder "dicktengleiches A" fände ich gut. Gismatis 02:55, 17. Okt. 2007 (CEST)

Das Problem mit dem Abstrich

ҪҾҢ

Ich mag es wirklich nicht, das alte Thema wieder auf dem Tisch bringen zu müssen, aber es ist nun mal erforderlich:

In Unicode gibt es den "descender", der hier mit "Abstrich" übersetzt wurde. Was vergessen wurde, ist, dass es drei Formen des "descenders" gibt, die sich beträchtlich voneinander unterscheiden und teilweise nichts mit einem Abstrich zu tun haben: (siehe Zeichenbox rechts)

  1. In Unicode 1.0 war dies noch eine Cedille, das später zum descender umgedeutet wurde. Das Diakritikum, dass hier verwendet wird, mag wohl einer Cedille ähnlich sehen, aber es ist ein anderes Zeichen, ungefähr wie ein gespiegeltes Ogonek (an dieser Stelle möchte ich auf einen Fehler in Arial Unicode MS hinweisen, der hier schlicht einen Ogonek verwendet – beim anderen Fall, Ҙ, wird eine echte Cedille angebracht, beides ist allerdings falsch). Bei diesem Fall weiß ich ehrlich gesagt nicht, wie das Diakritikum beschrieben werden sollte – ich hätte Haken verwendet, das wird jedoch bereits für z. B. Ӈ verwendet, und mindestens bei meiner Schrift sieht es deutlich anders aus.
  2. Das Stück hieß mal Ogonek, wurde später unter dem UCS-Regime ein descender. Ehrlich gesagt ist mir nur ein Fall bekannt, bei dem dieses Diakritikum verwendet wird – dieser – und bei meinen Schriften ist er auch identisch mit einem Ogonek, sodass ich diese Übersetzung gleich vorschlagen würde.
  3. Das hier ist der echte descender. Als Unicode noch in den Kinderschuhen stand, wurde noch zwischem linkem und rechtem Abstrich unterschieden, da z. B. bei Ч beide Fälle existieren, dies wurde später durch sprachspezifische Beschreibungen gelöst. Ich denke, hier gibt es keinen Diskussionsbedarf, da Abstrich hier wirklich passt.

-- Prince Kassad 20:29, 16. Okt. 2007 (CEST)

Vergleichsbild
Ich habe jetzt ein Bild hochgeladen, um das ganze zu verdeutlichen.
  1. Zeile: Ҫ, Ҿ und Ң, in Serifschrift und serifenlos
  2. Zeile: Vergleich zwischen Ҿ und Ǫ (lateinisches O mit Ogonek)
  3. Zeile: Vergleich zwischen Ç (lateinisches C mit Cedille) und Ҫ
  4. Zeile: Arial Unicode MS-Sonderformen
-- Prince Kassad 19:51, 17. Okt. 2007 (CEST)

Diese Seite ist 1.132 kB groß.

wenn man alle eingebundenen Vorlagen substet, ist diese Seite über ein Megabyte groß. Damit können nicht mal diese Artikel mithalten. Auf meinem Computer braucht sie Ewigkeiten zum Laden. Ist so was nötig? Reichen nicht Links auf die Unterseiten? --androl ☖☗ 11:46, 12. Dez. 2007 (CET)

Bei der Planung wurde der Bedarf nach einer Übersichtsseite berücksichtigt - dafür scheint die Liste der Unicode-Blöcke missbraucht worden zu sein. Prinzipiell finde ich aber, dass es einige Leute gibt, die gerne alle Unicode-Zeichen auf einer großen Seite und nicht 114 verschiedenen kleinen Seiten aufgelistet haben wollen. -- Prince Kassad 13:40, 12. Dez. 2007 (CET)

Löschdiskussion

Zur allgemeinen Information: Übrigens gibt es seit einigen Tagen einen erneute Löschantrag gegen alle Artikel, die auf dieser Seite zusammengefasst sind, die sich als Vorlagen-Löschantrag getarnt hat. --Daniel Bunčić 13:12, 18. Dez. 2007 (CET)

Ja, und außerdem wurde klammheimlich Unicode-Block Vereinheitlichte CJK-Ideogramme, Erweiterung B schnellgelöscht! Gismatis 06:19, 23. Dez. 2007 (CET)
Das müsste in die WP:LP gesetzt werden (mit dem Hinweis auf den Gesamtzusammenhang). Ich bin im Moment etwas weit draussen aus dem Gebiet, sonst würde ich das übernehmen ... --Reiner Stoppok 21:41, 23. Dez. 2007 (CET)
Siehe die Löschorgie laut Logbuch: [6]. – Simplicius 00:47, 24. Dez. 2007 (CET)
Es gibt nun auch einen Löschantrag gegen Vorlage:Navigationsleiste Unicode.
Peinlich. – Simplicius 13:00, 23. Dez. 2007 (CET)

Aufteilungen bzw. Redundanz?

Mir ist eines nicht klar. Einerseits gibt es Artikel bzw. Listen mit kleinen Blöcken, dann wiederum die momentan sieben großen Listen. Entsteht dadurch nicht Redundanz? Wäre es nicht sinnreicher und eindeutig, eine Liste der Blöcke zu erstellen und die restlichen Lücken mit Einzellisten zu erschliessen? – Simplicius 12:59, 23. Dez. 2007 (CET)

So hab ich mir das ganze auch gedacht. Allerdings gibt es einige Leute, die unbedingt eine vollständige Liste haben wollen. -- Prince Kassad 13:23, 23. Dez. 2007 (CET)

Eine Frage: was soll das jeweilige <control> bedeuten, z.B. in Unicode-Block Basis-Lateinisch? – Simplicius 14:13, 23. Dez. 2007 (CET)

Im Unicode-Standard sind die Steuerzeichen die einzigen Zeichen, die keine Bezeichnung tragen. In den Tabellen werden sie aber meistens <control> genannt, eben weil es Steuerzeichen sind. -- Prince Kassad 14:18, 23. Dez. 2007 (CET)
Dann sollte man das gegen "ohne Bezeichnung" ersetzen. – Simplicius 14:31, 23. Dez. 2007 (CET)

In der Liste der Unicode-Blöcke habe ich mal angefangen, die Artikel über die realisierten Blöcke zu verlinken. Das ist noch nicht ganz fertig. Wer erstellt denn schon mal die fehlenden Artikel?
Ich verstehe langsam, dass die acht Listen nicht redundant sind, weil sie mit Vorlagen arbeiten und einfach nur die vorhandenen Artikel über die einzelnen Blöcke darstellen. – Simplicius 21:12, 23. Dez. 2007 (CET)

Ich blick in der Struktur nicht durch. Einerseits gibt's Monsterlisten wie Liste der Unicode-Zeichen/2000 bis 2FFF, die regelmäßig meinen Browser (Firefox 2.0.0.5) einfriert und andererseits gibt's Einzellisten wie Unicode-Block Buchstabenähnliche Symbole, die ich wesentlich angenehmer finde. Wo sind denn da Vorlagen im Spiel? Und gibt es wirklich jemanden, der die browsertötenden Monsterlisten möchte? Ich wäre glücklich, wenn wir uns auf die Einzellisten beschränken würden und die bisherigen Monsterlisten auf kurze weiterführende Einleitungen zu den Einzellisten beschränkten. Wenn ich mitarbeiten möchte, soll ich dann die Einzellisten oder die Monsterlisten bearbeiten? Verwirrte und weihnachtliche Grüße von --j ?! 10:42, 24. Dez. 2007 (CET)
Wenn du den Quelltext einer Monsterliste öffnest, hier mal das edit-link, dann siehst du, dass da die Einzellisten als Vorlagen eingebunden werden. Es ist also nur eine andere Ansicht. Redundanzen in der Form, dass es an verschiedenen Stellen Tabellen zum gleichen Thema gäbe, sind nicht der Fall. Liebe Grüsse, – Simplicius 11:26, 24. Dez. 2007 (CET)
Tatsächlich. Jetzt sehe ich auch meine gestern durchgeführte Änderung der Teilliste in der Monsterliste. Da hatte ich wohl Tomaten auf den Augen. Trotzdem töten die Monsterlisten meinen Browser, ich vermute es hängt mit dem Sortable-JavaScript-Code zusammen. --j ?! 11:59, 24. Dez. 2007 (CET)
Das kann natürlich sein.
Ich habe die Vorlage mal optimiert. Das Rausnehmen der Dokumentation begünstigt ein bisschen den Ablauf. Die Fehlermeldung "2 Megabyte" betrifft nur die Interna, nicht den Umfang der resultierenden Seite.
Die Sortable-Funktion könnte man sicherlich auch rausnehmen, da sie vielleicht nicht allzu erforderlich ist.
Falls es noch kein Portal:Unicode gibt, sollte man es gründen.
Ziele: Vervollständigung, Aktualisierungen, News vom Konsortium, Wikipedia-Benutzerberatung.
Simplicius 12:16, 24. Dez. 2007 (CET)
Für den Zweck hatte ich mal ein Wikipedia:WikiProjekt Unicode gegründet, das aber noch nie wirklich aktiv war. Wenn du Lust hast, kannst du es ja aufwecken. -- Prince Kassad 12:31, 24. Dez. 2007 (CET)
Danke für den Hinweis, ich nehm’ das Projekt mal auf meine Beobachtungsliste. --j ?! 13:03, 24. Dez. 2007 (CET)

Ungültiges Archivierungsziel

Die Zielangabe bei der automatischen Archivierung dieser Seite ist ungültig. Sie muss mit demselben Namen wie diese Seite beginnen. Wende dich bitte an meinen Besitzer, wenn das ein Problem darstellen sollte. ArchivBot 12:11, 29. Dez. 2007 (CET)

Ich war so frei, den Fehler gemäß Hilfe:Archivieren#Häufige Fehler zu fixen. --Buffty WechselWort 01:01, 30. Dez. 2007 (CET)

Ungültiges Archivierungsziel

Die Zielangabe bei der automatischen Archivierung dieser Seite ist ungültig. Sie muss mit demselben Namen wie diese Seite beginnen. Wende dich bitte an meinen Besitzer, wenn das ein Problem darstellen sollte. ArchivBot 12:15, 30. Dez. 2007 (CET)

Und wieder zurück... --Buffty WechselWort 14:28, 30. Dez. 2007 (CET)

MediaWiki-Beschränkung

Mir ist gerade aufgefallen, dass die vollständige Liste die Seitenbeschränkung von 2 MB überschreitet. Das heißt, dass die Blöcke, die weiter hinten gelistet sind, durch einfache Links ersetzt werden. Hier muss dringend eine Lösung gefunden werden. -- Prince Kassad 13:05, 14. Dez. 2007 (CET)

Bist du sicher, dass sich diese 2-MB-Grenze nicht auf den Quelltext bezieht? Bei mir nämlich wurde die Seite stets vollständig angezeigt. Woher weißt du das eigentlich mit der Begrenzung? Gismatis 06:30, 23. Dez. 2007 (CET)
Hier ist die englischsprachige Seite dazu -- ich weiß nicht, ob es dazu eine deutschsprachige Entsprechung gibt und ob die Beschränkungen in der deutschsprachigen Wikipedia dieselben sind. Joriki 04:53, 3. Jan. 2008 (CET)

nowiki/noinclude-Sequenz am Ende

Am Ende des Artikels findet sich folgende Sequenz:

 <noinclude>{{Navigationsleiste Unicode}}
 <nowiki>[[Kategorie:Zahl]]</nowiki></noinclude>
 

Wieso ist das in <noinclude>..</noinclude> eingeklammert, obwohl es sich nicht um eine Vorlage handelt? Und warum ist hier die Kategorie Zahl in nowiki eingeklammert? Wenn dies nur vorläufig drin stehen soll, könnte es doch auch auskommentiert werden. --AFBorchert 12:59, 30. Dez. 2007 (CET)

Die Vorlage steht in den Tags damit die Navileiste nicht erscheint wenn diese Seite als Vorlage eingebunden wird und die Kategorie ist auch wieder drin (war nur wegen einer Verschiebung drausen).--Τιλλα 2501 ± 15:55, 30. Dez. 2007 (CET)
Danke für die Antwort, sie beantwortet jedoch keine meiner beiden Fragen. Erstens erscheint es mir als reichlich ungewöhnlich, dass reguläre Artikelseiten auch als Vorlage eingebunden werden. Und zweitens bleibt immer noch die Frage, warum hier die Kategorie Zahl so seltsam mit aufgenommen ist. Grüße, AFBorchert 16:37, 30. Dez. 2007 (CET)
Der Artikel wird in der Liste von Unicode-Zeichen eingebunden und die Kategorie:Zahl hätte ich auch auskommentieren können, jedoch führen beide Wege zum selben Ziel.--Τιλλα 2501 ± 23:32, 30. Dez. 2007 (CET)

(von Diskussion:Unicode-Block Zahlzeichen verschoben.--Τιλλα 2501 ± 14:03, 6. Jan. 2008 (CET))

Warum "von der Verwendung abzuraten"?

Lieber Prince Kassad, Du hast geschrieben: "Da diese Zeichen problemlos mit normalen Buchstaben dargestellt werden können, ist von der Verwendung abzuraten." Ich habe zwar nur einmal in meinem Leben, vor fast zehn Jahren, mit einem Textverarbeitungsprogramm gearbeitet, das speziell für das Japanische gedacht war und deshalb von oben nach unten schreiben konnte, aber ich kann mich erinnern, dass man so etwas wie "100 km²" dort untereinander nur als

1
0
0
k
m
²

hätte schreiben können. Da ist

1
0
0
㎢

doch besser. Vielleicht können moderne Textverarbeitungsprogramme so etwas auch ohne diesen Unicode-Block, das weiß ich nicht. Jedenfalls habe ich auf den Seiten des Unicode-Konsortiums keinen Hinweis darauf gefunden, dass von der Benutzung dieser Zeichen abgeraten würde oder sie gar als "deprecated" bezeichnet wären. Hast Du dafür eine Quelle? --Daniel Bunčić 12:14, 27. Sep. 2007 (CEST)

(von Diskussion:Unicode-Block CJK-Kompatibilität verschoben.--Τιλλα 2501 ± 14:19, 6. Jan. 2008 (CET))

Darstellung

Wäre es sinnvoll dem unbedarften Leser zu erklären, welche Schritte er unternehmen muss um die Zeichen anzuzeigen? Ich sehe nur lauter kleine Vierecke. --Agadez 16:02, 17. Okt. 2007 (CEST)

[7] - Sun-ExtB herunterladen und installieren, dann sollten die Zeichen erscheinen. -- Prince Kassad 16:41, 17. Okt. 2007 (CEST)
Hallo, kann man das ganze hier nicht irgendwie anders lösen? Aufteilen? Ich sehe nur Fragezeichen, zudem versagt mein System. Beim ersten aufrufen hat er sich "aufgehängt" Ich habe nur eine recht langsame Internetverbindung. Gruß -- Rainer Lippert 09:23, 21. Okt. 2007 (CEST)
Oh, das ist super! Vielen Dank für den Link! Eigentlich müsste ja die Wikipedia diese Schriftarten direkt anbieten, finde ich. Auf einer Hilfeseite würden alle benötigten Schriftarten mit einer Nummer versehen aufgelistet. Im Artikel könnte dann einfach stehen: "Für die Darstellung aller Zeichen auf dieser Seite benötigen Sie die Schriftart Nr. 7". Noch besser wäre natürlich, aber da weiß ich halt nicht, ob das technisch überhaupt möglich wäre, wenn nur bei Bedarf automatisch eine Meldung eingeblendet würde. Gismatis 15:05, 21. Okt. 2007 (CEST)
Ich meine mehr so etwas wie eine „Anleitung“ für OMA, der sicher nicht unbedingt klar ist, dass sie sich dazu ein extra Programm runterladen muss, geschweige denn welches. --Agadez 12:29, 21. Okt. 2007 (CEST)
Das ist die Aufgabe von Wikipedia:UTF-8-Probleme – nur eine Auflistung von Schriften pro Schriftsystem ist bisher noch nicht da, daher muss man in den angegebenen Links selber suchen. Hinweise in Artikeln wurden bisher abgelehnt. -- Prince Kassad 14:11, 21. Okt. 2007 (CEST)

(von Diskussion:Unicode-Block Vereinheitlichte CJK-Ideogramme, Erweiterung B verschoben.--Τιλλα 2501 ± 14:31, 6. Jan. 2008 (CET))

Buchstabenbezeichnungen

"Lateinische Kleines a" würde ich als "Lateinischer Kleinbuchstabe A" bezeichnen. Die anderen entsprechend. --Reiner Stoppok 11:36, 16. Jun. 2007 (CEST)

Dieser Abschnitt kann archiviert werden. Prince Kassad 12:38, 12. Feb. 2008 (CET)

Laaange Artikel

Wenn wir schon grosse artikel machen warum packen wir den (http://de.wikipedia.org/wiki/Liste_von_Unicode-Zeichen/Vereinheitlichte_CJK-Ideographen%2C_Erweiterung_B)nicht auch noch rein

Dann wäre der Artikel unlesbar, weil auch die besten Rechner da abstürzen. -- Prince Kassad 11:46, 25. Aug. 2007 (CEST)
Dieser Abschnitt kann archiviert werden. Prince Kassad 12:38, 12. Feb. 2008 (CET)

Ti

Ein "Ti" gibt es so dargestellt nicht! Das Zeichen, welches heir als "Ti" beschireben wird, ist ein "Chi" Ein "Ti" ist das Zecihen eines "Te"s mit einem kleinen "i" dahintergeschireben 88.72.30.6 19:43, 28. Okt. 2007

Da wurde auch nicht das Hepburn-System verwendet! Gismatis 03:09, 29. Okt. 2007 (CET)

(von Diskussion:Unicode-Block Katakana verschoben.--Τιλλα 2501 ± 14:15, 6. Jan. 2008 (CET))

siehe auch http://www.decodeunicode.org/u+30C1 --androl ☖☗ 19:41, 19. Jan. 2008 (CET)

Technische Raffinessen zur Seiteneinbindung

Der Quelltext der Seite Vollständige Liste der Unicode-Zeichen ist jetzt noch kürzer und einfacher geworden und hat den zusätzlichen Clou, dass der "Bearbeiten"-Link in jeder Kapitelüberschrift tatsächlich direkt auf die richtige Einzelseite führt.
Leider habe ich gerade gesehen, dass der Hinweis "[Bearbeiten]" nun auch im Inhaltsverzeichnis der Seite erscheint, da ich ihn ja in die Überschrift einbauen musste. Dafür finden wir bestimmt auch noch eine Lösung (aber nicht mehr heute)... --Daniel Bunčić 22:06, 16. Sep. 2007 (CEST)

Dieser Abschnitt kann archiviert werden. Prince Kassad 15:01, 25. Feb. 2008 (CET)

Löschungen Artikel der Vorlage:Navigationsleiste Unicode und Liste der Unicode-Zeichen

Liebe Mitarbeiter und Sympathisanten! Am 26. Dezember 2007 wurde die Arbeit eines halben Jahres zunichte gemacht! Ich schlage vor, dass wir hier oder anderswo das weitere Vorgehen an zentraler Stelle besprechen, um die Kräfte zu bündeln, und damit alle über alles rechtzeitig informiert sind. Gismatis 21:22, 26. Dez. 2007 (CET)

Zur (archivierten) Löschprüfung

Ein wenig Planungssicherheit über einen längeren Zeitraum sollte schon gewährleistet sein. Es kann nicht angehen, dass die Entscheidungen (bei eingehaltenen Auflagen!) aus dem letzten LA gegen die Unicode-Liste nicht berücksichtigt werden. Admin Benutzer:Thogo, den ich gerade in der Sache angeschrieben habe, hatte der Liste seinerzeit mit seiner Entscheidung ihre (verdiente) Chance gegeben. --Reiner Stoppok 21:59, 26. Dez. 2007 (CET)
Hm, ich vermute mal, my name hat schlichtweg nicht gemerkt, dass da schonmal eine Löschdiskussion lief. Der war ja auch noch im alten Lemma. Hat ihn übrigens mal jemand über diese Diskussion hier informiert? --Thogo BüroSofa 22:17, 26. Dez. 2007 (CET)
Soeben --Reiner Stoppok 22:37, 26. Dez. 2007 (CET)
Wie kann ich helfen? Redlinux 23:36, 26. Dez. 2007 (CET)
Indem Du - wie übrigens wir anderen auch alle - erst einmal geduldig die Antwort von Benutzer:my name abwartest. Gruß --Reiner Stoppok 23:44, 26. Dez. 2007 (CET) PS: Das war nämlich der löschende Admin ...

Vielleicht wäre es besser, die Zeichen Tafelweise als Grafik einzubinden ? Die wäre schwarz-weiss und lädt sich schneller in den Browser. Ein Hauptargument gegen die Listen war die lange Parserzeit. Die Grafiken kommen dann nach Commons und de:WP hat Ruhe. Augiasstallputzer  00:20, 27. Dez. 2007 (CET)

Also die Einzelblöcke haben bei mir nie lange gedauert. Die waren ja auch nicht so lang. Dass Grafiken schneller laden, glaube ich kaum. HTML hat noch den Vorteil, dass die Zeichen skaliert und außerdem extern weiterverwendet werden können. Dafür wäre die Darstellung nicht von geladenen Schriftarten abhängig. Gismatis 03:31, 30. Dez. 2007 (CET)

Zuerst einmal gebe ich zu, von der alten Diskussion nichts gewusst zu haben. Im Nachhinein muss ich aber sagen, dass sich wohl an meiner Entscheidung nichts geändert hätte: Dortige Entscheidung war:

„Bleibt vorerst

Thogo

verbunden mit dem eindeutigen Auftrag, die Listen zu verbessern. Dies ist offensichtlich nicht ausreichend, wenn überhaupt, geschehen. Ich bedanke mich übrigens ausdrücklich für den freundlichen und engagierten Ton. Ich verstehe, dass ich hier einiges "zerstört" habe, es war die schwerste Löschentscheidung, die ich je hatte. Und sie war keine "Spaßentscheidung": Während mich ein "behalten" lediglich zwei Edits gekostet hätte, kostete mich das Löschen eine halbe (!) Stunde. Von daher ist es auch nicht ganz einfach, das ganze im Benutzernamensraum wiederherzustellen, ich würde das nur mit einem oder mehr Admins zusammen machen. --my name 01:40, 27. Dez. 2007 (CET)

War es nicht absehbar, dass die Benutzer das Material weiterverwenden möchten? Ich finde, in diesem Fall hätten die Artikel direkt in einen anderen Namensraum verschoben werden können, bevor sie endgültig gelöscht worden wären. Ich verstehe sowieso nicht, warum gelöschte Artikel nur noch für Administratoren abrufbar bleiben. Anders wäre es viel einfacher. Ist es eigentlich möglich, die ganze Versionsgeschichte extern abzuspeichern? Gismatis 02:30, 27. Dez. 2007 (CET)
Das mit der Weiterverwendung wurde auf der LD nicht erwähnt, weswegen ich es nicht in einen BNR verschoben habe. Die Versionsgeschichte kann man extern abspeichern, indem man sie per Copy&Paste kopiert. --my name 03:55, 27. Dez. 2007 (CET)
Es hat auch echt niemand von uns mit der Löschung gerechnet, aber egal, das ganze System ist optimierungswürdig. Mit dem externen Abspeichern der Versionsgeschichte meinte ich nicht nur die Übersicht, sondern dass alle einzelnen Änderungen, das heißt also auch alle älteren Artikelversionen abgespeichert werden. Gismatis 04:15, 27. Dez. 2007 (CET)
@Gismatis: Ja, das ist möglich. Du kannst (natürlich nur, wenn der Artikel gerade nicht gelöscht ist) mit Special:Export/Artikelname den ganzen Artikel mit allen früheren Versionen exportieren. Musst halt nur den Haken bei "nur aktuelle Version exportieren" rausmachen. --Thogo BüroSofa 14:37, 27. Dez. 2007 (CET)
Danke, Thogo! Sowas hab ich gesucht! Gismatis 01:15, 28. Dez. 2007 (CET)
Ich empfehle eine Wikipedia:Löschprüfung. Insbesondere die Auswahl der gelöschten Artikel ist logisch nicht nachvollziehbar. Offenbar hat my name lediglich zwei von mir in der Löschdiskussion als Beispiele vorgebrachte Artikel behalten, und andere gleichwertige gelöscht. Da können wir auch gleich würfeln. Abgesehen davon sind drei Monate (von September bis Dezember) kein ausreichender Zeitraum zum Verbessern eines so umfangreichen Werkes. --j ?! 09:25, 27. Dez. 2007 (CET)
Schon mal nachgedacht, dass es gar nicht trivial ist, diese Zeichen abzubilden?
Ich bin gerade informiert worden. Mein Standpunkt dazu: In der Wikipedia darf jeder meckern, das ist erlaubt. Leider kann auch jeder admin werden, wenn er rein gruppendynamisch "Wikipedia ist keine Datenbank" oder dergleichen nachplappert. So wird das alles zum Löschbingo.
Nun kann man das auch noch in die Seite Löschprüfung wegen Wiederherstellungswunsch einstellen. Mit dem gleichen Zeitaufwand hätte man auch die Listen vervollständigen können. Auf Dauer vertreibt man so jeden produktiven Benutzer. Die Verhältnisse in der Wikipedia verbessern sich somit nicht, sondern werden immer chaotischer und unproduktiver. Man muss wohl selbst ein Volltrottel sein, um so etwas längere Zeit auszuhalten.
Da gibt es etliche Beispiele. Ohne genauere Kenntnis von Datenbanksystemen könnte man zum Beispiel gar keine Wikipedia betreiben. Also löschen welche vermutlich gerade die Liste von Datenbankverwaltungsprogrammen (Löschantrag läuft). Ohne Unicode könnte man die Wikipedia nicht in 200 Sprachen betreiben. Also muss hier auch jemand erst mal auf die Löschknöpfe drücken. – Simplicius 09:35, 27. Dez. 2007 (CET)
PS, in der Artikeldiskussionsseite, die ebenfalls gelöscht wurde, hat JPP ja schon einen Hinweis gegeben: die Sortierungsfunktion in den Tabellen ist gar nicht zwingend erforderlich und frißt einige Ressourcen.
Im übrigen wurde auch Liste der Unicode-Blöcke vom selben Admin gelöscht. Gab es darauf überhaupt einen Löschantrag? Hier reichts, wenn die Liste bis heute abend nicht wieder da ist, werde ich ein DEADMIN gegen Admin Benutzer:My name in Gang setzen. Simplicius 09:38, 27. Dez. 2007 (CET)
Ich sehe gerade, die Einzellisten wurden auch alle gelöscht. Das wird ja immer besser.
Da noch keiner den Wiederherstellungsantrag gestellt hat,
hier: Wikipedia:Löschprüfung#Liste der Unicode-BlöckeSimplicius 09:49, 27. Dez. 2007 (CET)

Die jetzige Diskussion scheint wieder in die gleichen Bahnen zu münden wie die Löschdiskussionen. Damit kommen wir wahrscheinlich nicht weiter. Vielleicht sollten die technischen Aspekte wie

  • Serverbelastung
  • Seitengröße
  • Tabellen

und die inhaltlichen

getrennt diskutiert werden. Die technischen Probleme sollten sich wohl mit vertretbarem Aufwand lösen lassen - da die Artikel im Benutzernamensraum verfügbar sind, könnte daran gearbeitet werden.

Das Hauptargument von my name zur Begründung der Löschung ("Das ganze verstößt gegen WP:WWNI und vermittelt kein Wissen.") setzt eine Einigung darüber voraus, was Wissen eigentlich ist. Bezeichnenderweise ist der Artikel Wissen seit längerer Zeit als überarbeitungsbedürftig gekennzeichnet. Einen Artikel DIKW wie in der englischen Wikipedia, der versucht, die Begriffe Daten, Informationen, Wissen und "Weisheit" voneinander abzugrenzen, gibt es in der dt. Wikipedia bisher nicht. In der Löschdiskussion haben mehrere die Anwendbarkeit von WP:WWNI mit guten Gründen bezweifelt. Daß my name deshalb seine Entscheidung nicht ausführlicher begründet hat, ist sehr bedauerlich. Mein Vorschlag wäre es, für die Löschprüfung Argumente zu sammeln, die zeigen, daß die Artikel wichtige Informationen zum Unicode-Standard enthalten, die beim Leser zum Wissenszuwachs führen ("Knowledge is created by using the information for action. Knowledge answers the question "how". Knowledge is a local practice or relationship that works." - en:DIKW). Da der Artikel Liste der Unicode-Blöcke wiederhergestellt wurde, scheinen die Voraussetzungen für einen positiven Ausgang gegeben zu sein. --ThT 00:12, 28. Dez. 2007 (CET)

Naja, solch ein Artikel wäre sicherlich sinnvoll, weil es verschiedene Ansätze gibt. Ein Ansatz aus der Wirtschaftsinformatik: Daten sind insbesondere Zahlenwerte usw. und sie unterliegen einer Norm. Informationen werden aus den Daten gebildet und unterliegen der Konvention. Wissen ensteht durch Informationen. So entsteht vermutlich auch eine Anschauung. Aufgrund von Wissen trifft man Entscheidungen, deren Qualität von all dem Genannten abhängt. Um es an einem Beispiel zu erläutern: Daten: 5 °C, Zahlenwert, Temperaturskala nach Celsius. Information: Es ist kalt. Ein Eskimo würde das vielleicht als warm empfinden. Wissen: Wer sich nicht warm anzieht, kriegt eine Erkältung. Entscheidung: Ich ziehe meine Wollmütze an. – Simplicius 13:42, 7. Jan. 2008 (CET)

Wiederherstellungen

Freunde, heute hat Benutzer:Tilla alle Artikel wiederhergestellt. Für diesen Schritt und die damit verbundene Mühe gebührt ihm großen Dank. Ich bin mir sicher, dass dadurch die Position der Befürworter unserer Arbeit innerhalb der Wikipedia gestärkt worden ist. Es war schön, dass sich in der Löschprüfung so viele zu Wort gemeldet haben und sich für eine Wiederherstellung eingesetzt haben. Einen großen Dank an alle! Gismatis 09:54, 30. Dez. 2007 (CET)

Nach meiner weihnachtsbedingten Offline-Zeit kann ich mich nur bei Tilla und allen, die mit Argumenten zum Erfolg der Löschprüfung beigetragen haben, bedanken. Wenn ich demnächst wieder zu Hause bin, beteilige ich mich auch an der weiteren Verbesserung der Seiten. --Daniel Bunčić 11:44, 30. Dez. 2007 (CET)

Übersetzungsvereinbarungen

Folgende Wörterliste enthält Wörter aus der Originalbeschreibung, für die sich nebenstehende Übersetzung als Konsens herausgebildet hat. Um eine gewisse Einheitlichkeit zu gewährleisten, sollte stets der angegebene deutsche Ausdruck verwendet werden.

  • bar Je nach Lage: Querstrich, Schrägstrich, senkrechter Strich (wie stroke)
  • above übergesetzt (z. B. "mit übergesetzter Tilde")
  • below untergesetzt (z. B. "mit untergesetztem Komma")
  • caron Hatschek
  • diaeresis Trema
  • turned gedreht
  • stroke Je nach Lage: Querstrich, Schrägstrich, senkrechter Strich (wie bar)

Noch unklar

Für die weitere Aufnahme in die Wörterliste schlage ich vor:

  • reversed gewendet (Das Zeichen wird vertikal horizontal gespiegelt, z. B. ɘ/e)
  • inverted umgekehrt (Das Zeichen wird horizontal vertikal gespiegelt, z. B. ʁ/ʀ)

Gismatis 22:53, 24. Sep. 2007 (CEST)

  • descender Zurzeit gibt es: "Unterlänge", "Abstrich" und "heruntergezogene Serife"

Gismatis 12:21, 6. Jan. 2008 (CET)

Wie wär's mit umgedreht bzw. auf dem Kopf stehend(er ... Buchstabe)? --Reiner Stoppok 04:04, 25. Sep. 2007 (CEST) PS: Vgl. Fliegenkopf hier bzw. umgedrehtes kleines E.

(Verschoben von Diskussion:Liste der Unicode-Zeichen. Gismatis 11:26, 9. Jan. 2008 (CET))

Lemmatauglichkeit der deutschen Übersetzungen

Bitte bei den Übersetzungen auch die Lemmatauglichkeit beachten. Will sagen: überdenken ob die deutsche Übersetzung als Lemma für einen Artikel tragfähig und eindeutig genug wäre. Da ist zur Zeit noch etwas der Wurm drin. --Reiner Stoppok 23:48, 16. Jun. 2007 (CEST)

Und dabei aufpassen, dass ihr hier keine Theoriefindung betreibt. --RokerHRO 23:33, 12. Mär. 2008 (CET)

Gesamtliste

Wie bekommen wir das Problem mit der Gesamtliste in den Griff? --Reiner Stoppok 15:48, 30. Dez. 2007 (CET)

Gibt es noch ein Problem? -- Prince Kassad 15:57, 30. Dez. 2007 (CET)
Ja, falls ihr mit „Gesamtliste“ solche Listen wie Liste der Unicode-Zeichen/2000 bis 2FFF meint. Die Liste tötet meinen Browser, und zwar massiv. Ursache ist offenbar JavaScript, also möglicherweise die Sortierfunktion. Wenn ich mal einen ganz frechen Änderungsvorschlag unterbreiten darf: Warum enthalten diese Listen nicht einfach nur pro Code-Block einen Absatz mit dem einleitenden Text und verweisen dann per Link auf die konkreten Code-Block-Artikel anstatt sie per Vorlage einzubinden. Das nähme Rücksicht auf normalsterbliche Internetbenutzer und wäre meiner unmaßgeblichen Meinung nach auch wesentlich angenehmer zu lesen. --j ?! 19:18, 30. Dez. 2007 (CET)
Man sollte erstmal nachdenken, ob bei manchen Blöcken die Sortierfunktion wirklich sinnvoll ist. Bei einigen Blöcken bezweifle ich dies stark. -- Prince Kassad 21:16, 30. Dez. 2007 (CET)
Aber auch unabhängig von der Sortierung mag ich die Vorlagenlösung nicht. Ich denke, es genügt, wenn die Tabellen in den konkreten Unicode-Block-Artikeln stehen. Ich sehe keinen Sinn darin, sie in einer großen Seite zusammenzufassen. Bin allerdings auch generell kein Freund überlanger Artikel. Alles, was länger als drei Bildschirmseiten ist, sollte zerlegt werden. --j ?! 22:21, 30. Dez. 2007 (CET)
So wie du das vorschlägst, habe ich mir das ursprünglich eigentlich auch gedacht. Aber andere wollten alles auf einen Blick. Und einen Vorteil sehe ich darin durchaus: Man kann, wenn man auf ein unbekanntes Zeichen im Internet stößt, das Zeichen im Gesamtartikel mit der Suchfunktion suchen, um herauszufinden, wo es überhaupt hingehört. Bei den einzelnen Listen ist das eher schwer. Ich persönlich allerdings verwende für die Suche sowieso die Zeichenpalette von Mac OS X. Falls jedes Betriebssystem eine solche Suchfunktion bereithält, würde dieses Argument ausscheiden. Was die Sortierfunktion betrifft, so habe ich von Beginn weg den Sinn derselben nicht verstanden. Die Zeichen sind ja bereits sortiert. Lasst sie uns entfernen, wenn die tatsächlich Ladeprobleme bereitet. Gismatis 06:24, 31. Dez. 2007 (CET)
"Man kann, wenn man auf ein unbekanntes Zeichen im Internet stößt, das Zeichen im Gesamtartikel mit der Suchfunktion suchen, um herauszufinden, wo es überhaupt hingehört." Sehr richtig. Und man kann gleich den deutschen Namen finden. --Reiner Stoppok 16:29, 31. Dez. 2007 (CET)
Moment mal, von welchem Artikel sprechen wir hier eigentlich? Wenn ich das Zeichen nicht kenne, muss ich doch sowieso die Mediawiki-Suchfunktion benutzen, weil ich nicht weiß, ob es nun in Liste der Unicode-Zeichen/0000 bis 0FFF, Liste der Unicode-Zeichen/1000 bis 1FFF oder sonstwo ist. --j ?! 16:55, 31. Dez. 2007 (CET)
Frohes Neues Jahr an alle!
Hinsichtlich der Gesamtliste in acht Teilen schlage ich vor, auf diese ganz zu verzichten. Ich denke, dass die Seite Liste der Unicode-Blöcke die Aufgabe hinreichend erfüllt, auf die Teilbereiche zu verweisen, soweit sie schon durch die Einzelartikel erschlossen sind.
Ich hoffe, dass die anderen Teilartikel bald fertig sind.
Ferner sollte man dort auf die Sortierbarkeit verzichten, weil einige dabei im Browser damit Schwierigkeiten haben.
Ferner denke ich, dass man diese Seite sogar nach Portal:Unicode umziehen sollte und dort sogar eine Fragen-Seite einrichten sollte.
Grüsse, – Simplicius 17:33, 1. Jan. 2008 (CET)
Auch dir ein frohes neues Jahr und ich schließe mich dem Wunsch an, auf die Gesamtliste in acht Teilen zu verzichten. --j ?! 18:33, 1. Jan. 2008 (CET)
Die Aufteilung war ja eine Notlösung wegen der Größe. Das Konzept mit der Gesamtliste ist jetzt wohl endgültig gescheitert. Ich fand halt die Lösung mit der Vorlage:Unicode-Block einbinden genial, bei der sich Benutzer:Buncic solche Mühe gegeben hatte. Mal schauen, was er dazu meint. Was die fehlenden Listen betrifft (das richtet sich jetzt an die "Neuen"): Ich möchte hiermit wieder einmal auf Benutzer:Buncic/Unicode aufmerksam machen. Dort findet man die fehlenden Listen zum Abarbeiten. Gismatis 19:50, 1. Jan. 2008 (CET)
Ich finde es jedenfalls besser, das intern innerhalb der Interessierten zu lösen und nicht per Löschdiskussion. Nach meiner Meinung ist die Schnittstelle über die Liste der Blöcke die beste Lösung. Ich finde, es sollte Daniel Bunčić entscheiden.
Allein die Sache mit der Verlinkung hat mich ein paar Stunden Arbeit gekostet, und eigentlich war das ja nur ein kleiner Beitrag. Demzufolge stecken in dem Projekt Unicode wohl viele Personentage Arbeitszeit, umgerechnet also mehrere tausend Euro Wert. Und ich glaube, langfristig zum Thema hier in der Wikipedia deutschsprachige Erläuterungen in aktuell gehaltener Form vorfinden zu können, ist für Menschen aus dem IT-Bereich und verwandten Gebieten ein großer Wert. Über die Löschung kann ich nur den Kopf schütteln. – Simplicius 23:46, 1. Jan. 2008 (CET)
Ein frohes Neues allerseits! Leider habe ich auch nach meiner Rückkehr nicht allzu viel Zeit, da beruflich viel zu tun, aber wenn schon meine Meinung gefragt ist, gebe ich sie hier gern zum Besten. Den Mehrwert einer aufgeteilten Gesamtliste sehe ich auch nicht. Wenn man keinen Artikel mit wirklich allen Blöcken (außer denen ohne Erläuterung der einzelnen Zeichen, also in der Form, wie wir sie bisher hatten) haben kann, dann reichen auch die Artikel über die Einzelblöcke. Zwei Drei Ideen hätte ich noch, über die ich gern Eure Meinung wüsste:
  • Könnte es ein Vorteil sein, die Tabellen in den Artikeln durch die den Navigationsleisten zugrunde liegende Technik ausklappbar zu machen? Sie würden dann beim Aufrufen des Artikels jeweils eingeklappt erscheinen (da ja auch noch die "richtige" Navigationsleiste auf der Seite vorhanden ist und daher die Gesamtzahl der Navigationsleisten > 1 wäre) und nur auf Wunsch ausgeklappt werden. Dadurch wären die Artikel mit noch wenig Text vielleicht auch für zukünftige Löschwütige direkt als gute Stubs erkennbar, weil die Tabellen optisch nicht so hervorstechen würden. Außerdem würde das, wie schon einmal festgestellt wurde, die Zeit, die der Browser zur Darstellung braucht (wenn auch nicht die Ladezeit), verringern.
  • Das größte Problem an der laaangen Gesamtseite ist m. E., dass man auf sie durch eine einfache Wikipedia-Suche unvermutet treffen kann und dann die Folgen, die das bei einer langsamen Internetverbindung hat, nur noch durch einen Browser-Neustart stoppen kann. Könnte es eine Lösung sein, die Gesamtseite (aber nicht die Artikel zu den einzelnen Blöcken!) tatsächlich in den Hilfe-Namensraum zu verschieben und dann in den relevanten Wikipedia-Artikeln mit entsprechenden Warnhinweisen auf diese Hilfe-Seite zu verweisen? --Daniel Bunčić 10:14, 2. Jan. 2008 (CET)
  • Die Liste der Unicode-Blöcke sieht nun so schön aus und ist so handlich, dass man sie doch direkt in den Artikel Unicode einbauen könnte, dann hätte man dort einen etwas längeren Artikel, der alle Informationen in ansprechender Form enthält, und etwas weniger Redundanz z. B. bei den Weblinks. Ich würde die Liste zwischen den Kapiteln "Versionen von Unicode" und "Darstellung auf dem Computer" einbauen. --Daniel Bunčić 10:40, 2. Jan. 2008 (CET)
Gegen die Integration der Liste der Blöcke in Unicode habe ich keine Einwände.
Die "Liste der Unicode-Zeichen/2000 bis 2FFF" usw. sollte man nach meiner Meinung ganz streichen. – Simplicius 00:45, 7. Jan. 2008 (CET)
Okay, ich habe die Blöckeliste also jetzt in Unicode integriert. Die Meinung auch der anderen Kollegen zu meinen anderen Vorschlägen würde mich aber auch noch interessieren. --Daniel Bunčić 10:44, 7. Jan. 2008 (CET)
Meine Argumente bezüglich dieser acht oder später neun Seiten sind:
  • sie verursachen nur Redundanz und keinen Mehrwert, weil die Information sowieso nur per Vorlage aus den Einzelartikeln eingebunden wird
  • sie bleiben grundsätzlich lückenhaft, weil es leere Zwischenbereiche gibt, die erst später genutzt werden
  • es gibt Benutzer, bei denen die Listen den Browser in die Knie zwingen
  • die wenigesten werden font-bedingt ein vollständige Darstellung erhalten
  • sie sind unbeliebt und machen somit das Projekt insgesamt nicht beliebter (vergl. die Löschung von über 100 Teilartikeln)
  • die Liste der Blöcke, nun in Unicode integriert, bietet genügend Überblick
Grüsse, – Simplicius 13:48, 7. Jan. 2008 (CET)
Hallo Daniel
  • Ein Einklappen der Tabellen fände ich nicht gut. Es handelt sich bei den Tabellen schließlich um den jeweiligen Hauptinhalt des Artikels. Den Vorteil der schnelleren Darstellbarkeit halte ich bei den allermeisten Listen für marginal. Auch das Verstecken der Tabellen vor Löschwütigen halte ich für den falschen Ansatz.
  • Was eine Gesamtliste im Hilfe-Namensraum betrifft, so bezweifle ich, dass die dort geduldet würde. Viele könnten die Liste dann ja trotzdem nicht verwenden. Außerdem wäre es auch da möglich, dass jemand mit der Volltextsuche in diesem Namensraum auf diese Liste stoßen würde. Wenn du eine solche Seite einrichten möchtest, wäre es aus meiner Sicht wichtig, dass du vorgängig abklärst, ob das Bedürfnis danach auch bei den anderen Benutzern, das heißt nicht nur bei uns Mitarbeitern hier, vorhanden ist. Ich würde mal bei Hilfe:Sonderzeichen nachfragen.
Gismatis 11:20, 9. Jan. 2008 (CET)

Lange Tabellen sind problematisch und umstritten. Das Problem wird nicht dadurch gelöst, dass man durch Vorlagentechnik noch längere Listen generiert. Es wäre gut, sich im Projekt intern darauf zu verständigen, auf diese acht Listen besser zu verzichten. Das wäre besser, als es wenn es zu einem erneuten Löschantrag kommt.--Τιλλα 2501 ± 13:30, 12. Jan. 2008 (CET)

Von Prince Kassad wurde noch mal etwas angestossen:
Wikipedia:Löschkandidaten/11._April_2008#Unicode-Sammellisten
Gruss – Simplicius 16:26, 11. Apr. 2008 (CEST)
Zu den eventuellen Folgen, siehe:
Benutzer_Diskussion:Prince_Kassad#Löschantrag_auf_Vorlagen-Listen
Grüsse – Simplicius 16:41, 11. Apr. 2008 (CEST)

Artikelnamen mit A, B usw.

Hi. In der Liste der Unicode-Blöcke sind Artikel wie Unicode-Block Verschiedene mathematische Symbole-A vorgesehen, analog zur englischen Bezeichnung Miscellaneous Mathematical Symbols-A. Das „A“ spielt in diesem Zusammenhang für mich aber eher die Rolle eines Untertitels und ist wohl nicht Teil eines Worts „Symbole-A“. Daher würde ich es mit einem Gedankenstrich von der Überschrift abtrennen, also Unicode-Block Verschiedene mathematische Symbole – A. Was haltet ihr davon? --j ?! 11:37, 31. Dez. 2007 (CET)

Da das A kein Untertitel, sondern eine fortlaufende Zählung ist, bin ich eher für ein Komma (Verschiedene mathematische Symbole, A). -- Prince Kassad 12:09, 31. Dez. 2007 (CET)
Einverstanden, also Unicode-Block Verschiedene mathematische Symbole, A. --j ?! 12:58, 31. Dez. 2007 (CET)
Müsste analog dazu der Unicode-Block Lateinisch, erweitert-A nicht in Lateinisch, erweitert, A umbenannt werden? --j ?! 14:55, 2. Jan. 2008 (CET)
Das erste Komma würde ich dann am besten streichen. -- Prince Kassad 15:00, 2. Jan. 2008 (CET)
Das scheint mir dann aber den Rechtschreibregeln zu widersprechen. Da ich hier unsicher bin: Was meint der Rest der hier mitlesenden? --j ?! 15:36, 6. Jan. 2008 (CET)

Da es sich um Eigennamen der Blöcke handelt, gehören nirgendwo Satzzeichen hinein und es gilt Großschreibung. Es muss "Unicode-Block Lateinisch Erweitert A" etc. lauten. Cäsium137 (D.) 17:18, 11. Apr. 2008 (CEST)

Da kann man drüber streiten, ob das Eigennamen sind oder Umschreibungen. --j ?! 23:13, 11. Apr. 2008 (CEST)

Geklärte Fragen

  1. GROSSSCHREIBUNG der ENGLISCHEN ORIGINALBEZEICHNUNGEN
  2. Reihenfolge: Unicode-Nummer, Zeichen, Beschreibung, Offizielle Bezeichnung
  3. (Alphabetisch) sortierbare Tabellen

--Reiner Stoppok 15:35, 18. Sep. 2007 (CEST)

Ok. Simplicius 10:59, 25. Mai 2008 (CEST)

Kummerkasten

Der Übersichtlichkeit halber kommt hier rein, worüber in den Diskussionen zu den Benennungsfragen noch Uneinigkeit herrscht. Bitte vervollständigen und nach Einigung entfernen. --Reiner Stoppok 14:51, 18. Sep. 2007 (CEST)

  1. Großschreibung versus Kleinschreibung
  2. Beschränkung auf lateinisches Basisalphabet (plus ä,ö,ü,ß) versus Zulassung von Sonderzeichen
Ok. Simplicius 10:59, 25. Mai 2008 (CEST)