Portal Diskussion:Unicode/Archiv/2010

O'Connor ode O’Connor?

Letzter Kommentar: vor 14 Jahren3 Kommentare3 Personen sind an der Diskussion beteiligt

Um welches Zeichen geht es hier eigentlich: en:O'Connor oder de:O’Connor? Besten Dank! – Simplicius 09:27, 14. Feb. 2010 (CET)

Hier haben wir einmal den normalen Hochstrich, und dann den typographisch korrekten Apostroph. Letzterer ist eigentlich korrekt, aber schwieriger einzutippen, weswegen er nicht all zu häufig verwendet wird. -- Prince Kassad 10:26, 14. Feb. 2010 (CET)

In diesem Fall ein typografischer Apostroph. Vor Kurzem ist mir in amtlichen Urkunden der Name Alʼin begegnet. Darin müsste es wegen Transliteration aus dem Arabischen U+02BC ʼ Modifikationsbuchstabe Apostroph sein. „Modifizierender Apostroph“ in der Liste ist falsch, da es sich bei diesen Zeichen ausdrücklich um Buchstaben handelt. Dies muss sich beispielsweise auf eine Blockmarkierung mit Doppelklick auswirken. -- Rainer Seitel 21:15, 21. Feb. 2010 (CET)

Broken Link

Letzter Kommentar: vor 14 Jahren2 Kommentare2 Personen sind an der Diskussion beteiligt

Auf der Seite http://de.wikipedia.org/wiki/Unicode-Block_Altgriechische_Zahlzeichen ist ein nicht mehr funktionierender Link:

Proposal to encode Greek Acrophonic characters in the UCS (Complete Outline of Ancient Greek Acrophonic Numerals; PDF-Datei)

-- Hakris 15:37, 14. Mär. 2010 (CET)

Sollte jetzt wieder funktionieren. -- Prince Kassad 15:43, 14. Mär. 2010 (CET)

Offizielle Bezeichnung von Steuerzeichen

Letzter Kommentar: vor 14 Jahren2 Kommentare2 Personen sind an der Diskussion beteiligt

ZU http://de.wikipedia.org/wiki/Unicode-Block_Basis-Lateinisch und in http://de.wikipedia.org/wiki/Unicode-Block_Lateinisch-1,_Erg%C3%A4nzung

Für die Codes von 0 (Null) bis dezimal 31 (Hexadezimal 0000 bis 001F) sowie von dezimal 127 bis 159 (Hexadezimal 007F bis 009F) gibt es zwar nach ISO/IEC 8859-1 und ISO/IEC 10646 keine druckbaren Zeichen, die Steuercodes sind aber bei Unicode.org festgelegt: http://www.unicode.org/charts/PDF/U0000.pdf sowie http://www.unicode.org/charts/PDF/U0080.pdf, ftp://ftp.unicode.org/Public/5.2.0/ucd/UnicodeData.txt, siehe auch: http://de.wikipedia.org/wiki/Steuerzeichen.

Von daher würde ich vorschlagen, die englischen Bezeichnungen der Steuerzeichen in die Spalte "Offizielle Bezeichnung" aufzunehmen.

-- Hakris 15:37, 14. Mär. 2010 (CET)

Unter der Spalte für die offizielle Bezeichnung, sowohl im PDF als auch in der Datenbank, steht schlichtweg <control>. Namen haben sie damit offiziell nicht. -- Prince Kassad 15:46, 14. Mär. 2010 (CET)

Was tun mit Unicode-Lemmata?

Letzter Kommentar: vor 14 Jahren6 Kommentare4 Personen sind an der Diskussion beteiligt

Seid gegrüßt Unicoder ;)

Seit einiger zeit fällt mir auf, dass es beim Umgang mit Unicode-Lemmata ein paar Inkonsistenzen gibt. Offensichtlich gibt es mehrere Ansichten, was mit solchen Lemmata passieren soll, und alle Varianten sind im Moment mehr oder weniger im Einsatz. Mir sind bisher hier folgende "Philosophien" zu dem Thema aufgefallen:

Unicode-Lemmata brauchen wir nicht
- Hauptargument ist: Das gibt sowieso sogut wie keiner ein.
- Mein gegenargument: Wenn ich auf einer Webseite ein Unicode-Symbol sehe, mit dem ich nichts anfangen kann, würde ich es gerne in das suchfeld von WP copy&pasten.)
- Beispiele: ☀, ☁, ☂ (Alle 3 haben eine Löschung wegen genau dem hinter sich)
Unicode-Lemmata redirecten auf das, was sie darstellen.
- Hauptargument: Naheliegendste Lösung. en.wikipedia.org machts auch so.
- Gegenargumente: Uneindeutig und Interpretationsspielraum. Das Komet-Symbol kann sowohl einfach ein Komet, als auch ein Meteorlogisches Symbol sein.
- Beispiele: ☄, ☃, ★
Unicode-Lemmata redirecten auf den entsprechenden Unicode-Block
- Beispiele: ☺, ☎, ☏
Unicode-Lemmata sind eigene Artikel
- Beispiel:  (wobei U+F8FF vlt ein Sonderfall ist)

Bei zum Beispiel arabischen Schriftzeichen ist es vlt eindeutig, aber mindestens beim Unicode-Block Verschiedene Symbole ist bisher alles vertreten. Und hier hätte ich gerne einen Konsens. Gibts Vorschläge, wie man das lösen könnte? Sollte es hier in der Diskussion jetzt keinen eindeutigen Konsens geben, wäre es auch möglich, ein Meinungsbild zu dem Thema zu erstellen.

--Stummi(D¦B) 17:52, 30. Mär. 2010 (CEST)

Ich würde für eine Mischung aus der zweiten und dritten Lösung tendieren. Wo die Sache eindeutig ist (etwa weil das Symbol selbst einen Artikel hat (etwa beim Totenkopf (Symbol)) gibt's einen Redirect darauf; in unschlüssigen Fällen auf den Unicode-Block, der ja auch eine Erklärung beinhaltet. --TheK? 20:44, 30. Mär. 2010 (CEST)

Das würde so dann aber wohl nur bei den Symbolen zutreffen. Bei einzelnen Schriftzeichen sehe ich keinen Mehrwert darin, sie irgendwohin weiterzuleiten. -- Prince Kassad 23:22, 30. Mär. 2010 (CEST)

Die Frage ist dann, *was* denn alles noch unter eindeutig fällt? Ist das Schneemansymbol zum Beispiel eindeutig? --Stummi(D¦B) 14:35, 31. Mär. 2010 (CEST)

Frage: Wäre es vielleicht sinnvoller, den Block , "Greek Extended" (Grec étendu) mit "Griechisch-Ergänzung" zu übersetzen? -- Hakris 15:32, 14. Apr. 2010 (CEST)

Die anderen zwei Blöcke mit "Extended" heißen auch Lateinisch, weiterer Zusatz und Äthiopisch, Zusatz. Ergänzung hingegen entspricht dem englischen "Supplement", siehe die Blöcke Kyrillisch, Ergänzung und Arabisch, Ergänzung. Unter dem Gesichtspunkt finde ich das keine gute Idee und glaube, wir sollten bei den Übersetzungen genau bleiben. -- Prince Kassad 18:16, 14. Apr. 2010 (CEST)

Suchfunktion

Letzter Kommentar: vor 14 Jahren2 Kommentare2 Personen sind an der Diskussion beteiligt

Ich möchte gerne wissen, welche Unicode-Nummern für ] und [ vergeben sind. Wo findet man entsprechende Suchfunktion? -- 77.181.255.2 19:02, 16. Apr. 2010 (CEST)

Interessanterweise nicht in der Wikipedia-eigenen Suche, da diese die Zeichen anscheinend gar nicht findet. Es gibt allerdings z. B. das hier. -- Prince Kassad 22:49, 16. Apr. 2010 (CEST)

Doppelte Namensangabe in Artikeln zu Unicode-Blöcken (erl.)

Letzter Kommentar: vor 14 Jahren7 Kommentare3 Personen sind an der Diskussion beteiligt

Hallo. In Abstimmung mit Reiner Stoppok möchte ich folgendes zur Diskussion stellen: In [1] habe ich die Meinung vertreten, dass bei derartigen Artikeln (z.B. Unicode-Block Limbu) der deutsche Name nicht nochmal explizit genannt werden soll (und schon gar nicht fettgedruckt), wenn er mit dem internationalen Namen übereinstimmt. In Fällen, in denen die Bezeichnung NICHT übereinstimmt (z.B. Unicode-Block Basis-Lateinisch) soll die deutsche Übersetzung allerdings genannt werden, aber vielleicht eher als ({{DeS|''Basis-Lateinisch''}}). Wie seht ihr das? Gruß... --Krd 12:24, 8. Jul. 2010 (CEST)

Es wäre ziemlich dumm, die deutsche Bezeichnung nicht einzufetten, schließlich stellt sie ja den Seitentitel dar, und der soll nach unseren Konventionen fettgedruckt sein. Bis jetzt war das allerdings die Praxis - die englische Bezeichnung war eingefettet, die deutsche hingegen komplett unformatiert. Ganz klar ist allerdings, dass in Fällen, in denen der deutsche und der englische Name identisch ist, der Name nur einmal genannt werden muss. Ich sehe da absolut keinen Sinn in einer Doppelnennung. -- Prince Kassad 12:42, 8. Jul. 2010 (CEST)

Ein einheitliches Erscheinungsbild fände ich nicht schlecht. --Reiner Stoppok 12:50, 8. Jul. 2010 (CEST) PS: Ich hatte mich in einigen Fällen (bei der einfachen Nennung) tatsächlich gefragt, ob das, was da steht, eine Übersetzung oder das Englische sein sollte.

Eigentlich sollte es kein Problem darzustellen, einfach die Fettschrift aus der englischen Bezeichnung zu entfernen. Damit wäre dann wirklich nur der Seitentitel fettgedruckt. -- Prince Kassad 13:00, 8. Jul. 2010 (CEST)

Und Unicode-Block?! --Reiner Stoppok 13:05, 8. Jul. 2010 (CEST) PS: Hm, vielleicht sollte das doch besser gar nicht angerührt werden. (Vielleicht habe ich das hier etwas übertrieben mit der Einheitlichkeit.)

"Unicode-Block" gehört IMHO zum Namen und auch zum Seitentitel und soll daher fettgedruckt bleiben. -- Prince Kassad 13:09, 8. Jul. 2010 (CEST)

Ok. Alles wie gehabt. ;) --Reiner Stoppok 13:38, 8. Jul. 2010 (CEST)

Vorschlag zur einheitlichen Formatierung

Letzter Kommentar: vor 14 Jahren11 Kommentare3 Personen sind an der Diskussion beteiligt

Nach den WP-Formatierungsregeln sollte zu Beginn stets das Lemma in bold wiederholt werden. Bei den Unicode-Blöcken ist zusätzlich die Verlinkung sinnvoll, und das ganze soll noch exakt (also mit der Unicode-offiziellen Benamung) und noch optimal lesbar sein. IMHO ist dies alles nur mit der folgenden Formatierung zu leisten:
Der Unicode-Block Tibetan (Tibetisch) (0F00–0FFF) ...
Denkbar wäre (weniger gut) auch stattdessen
Der Unicode-Block Tibetisch („Tibetan“, 0F00–0FFF) ...
wozu in beiden Varianten, oder zumindest in der zweiten, die Originalbezeichnung (Tibetan) auch kursiv gesetzt werden könnte.

Leider sind immer noch alle möglichen anderen Darstellungsformen vorhanden. Ich schlage vor, bei nötigen Änderungen ggf. immer auch gleich den Artikelbeginnn zu vereinheitlichen. Ok? -- sarang♥사랑 10:03, 18. Sep. 2010 (CEST)

Einverstanden. Wenn „Tibetisch“ eine offizielle Bezeichnung ist und mit der Übersetzung somit nicht gegen Wikipedia:Keine Theoriefindung verstoßen wird, wäre ich für die Einleitung

Der Unicode-Block Tibetisch (englisch Tibetan) (0F00–0FFF) ...

Grüße --RonaldH 10:18, 18. Sep. 2010 (CEST)

Die englische Bezeichnung sollte auf jeden Fall nach hinten. Schließlich erscheint diese Bezeichnung nicht im Lemma, und solange sie noch hintendran erscheint, gäbe es auch keine Probleme mit TF. Außerdem entspricht das dann auch den Tabellen, wo die englische Bezeichnung ebenfalls als letztes erscheint. -- Prince Kassad 10:45, 18. Sep. 2010 (CEST)

Ja, so erscheint es mir am sinnvollsten. Aber ihr wisst ja, wieviele Unicode-Block-Artikel es gibt – da sollten die vielen verschiedenen Schreibweisen alle nach und nach vereinheitlicht werden... Mit einem Tool ist das wohl schwierig zu machen? -- sarang♥사랑 12:19, 18. Sep. 2010 (CEST)

Naja... 150 Artikel kann man auch von Hand noch ändern, man braucht nur etwas Zeit. -- Prince Kassad 15:21, 18. Sep. 2010 (CEST)

Noch eine kleine Änderung:
Der Unicode-Block Tibetisch (englisch Tibetan, 0F00–0FFF) ...
vermeidet die zweimalige Klammerung und fasst die beiden Details in einer Klammer zusammen. Sieht IMHO besser aus – und wenn wir schon umfassend ändern und verbessern, sollte es optimal sein. Wenn da Konsens signalisiert wird, könnte ich beginnen [aber es ist ja weder wichtig noch eilig, und nur deswegen muss auch kein Block sofort angefasst werden].-- sarang♥사랑 06:07, 29. Sep. 2010 (CEST)

Gut und gerne. -- Prince Kassad 11:43, 30. Sep. 2010 (CEST)

Hab auch nichts dagegen. Ein systematisches Abarbeiten der 150 Artikel wäre sicherlich vorzuziehen, um keinen der Artikel liegen zu lassen. --RonaldH 15:09, 2. Okt. 2010 (CEST)

Nach weiterem nachdenklichen Betrachten finde ich es besser, in der Klammerung zuerst die Bereichsangabe und dann (ev. nach ein klein wenig deutlicherem Zwischenraum) die englische Bezeichnung zu schreiben − sonst könnte der Bereich wie ein Bestandteil des Englischen aussehen; auch erscheint mir der Bereich eine wichtigere Info zu sein als der sprachliche Hinweis. Nun also

Der Unicode-Block Verschiedene mathematische Symbole-B (2980–29FF; englisch Miscellaneous Mathematical Symbols-B) ...

Tut mir leid, dass ich da immer wieder mit Neuem komme − aber wenn wir schon alle UnicodeBlock-Artikel ändern wollen, dann möglichst optimal und relativ endgültig! -- sarang♥사랑 10:08, 16. Okt. 2010 (CEST)

Das wiederum finde ich keine gute Wahl. Der Bezug der englischen Übersetzung zu dem deutschen Text wird durch die Blockangabe optisch gestört. Um das Subjekt des Einleitungssatzes nicht zu überfrachten und einen der beiden Klammerzusätze aufzulösen, schlage ich vor:

Der Unicode-Block Tibetisch (englisch Tibetan) umfasst die Unicode-Nummern 0F00 bis 0FFF. <Nächster Satz>

Grüße --RonaldH 11:03, 16. Okt. 2010 (CEST)

Du hast recht, die Blockangabe würde die deutsche Bezeichnung (das Lemma) vom englischen Originaltitel zu weit entfernen. Ist wirklich nicht einfach. Keinesfalls aber geht „Unicode-Nummern“ für den Codepoint-Bereich. Um den Einleitungssatz kurz zu halten, bleibt es wohl am besten bei
Der Unicode-Block Tibetisch (englisch Tibetan; 0F00–0FFF) umfasst die Zeichen der ...
(getrennt mit Semicolon und etwas deutlicherem Zwischenraum). Damit gebe ich Ruhe, versprochen. -- sarang♥사랑 20:52, 18. Okt. 2010 (CEST)

Unicode-Block Verschiedene piktografische Symbole

Letzter Kommentar: vor 13 Jahren5 Kommentare2 Personen sind an der Diskussion beteiligt

Mag jemand korrekturlesen? -- Prince Kassad 22:38, 24. Dez. 2010 (CET)

Vielen Dank für die Arbeit! Mit welchem Font kann ich mir die Symbole denn anzeigen lassen? Betriebssystem ist Windows XP, Browser ist IE 7. Auf Anhieb kann ich erkennen, dass da etliche BKL-Seiten verlinkt sind. Die müssten noch aufgelöst werden. --RonaldH 23:20, 24. Dez. 2010 (CET)

http://users.teilar.gr/~g1951d/ und von dort die Schriftart Symbola herunterladen. -- Prince Kassad 23:38, 24. Dez. 2010 (CET)

Danke. Habe die Schriftart installiert, sie wird aber von dem IE7 nicht zur Darstellung der Symbole herangezogen. Weißt Du, woran das liegen könnte? --RonaldH 00:06, 25. Dez. 2010 (CET)

Ei der Internet Explorer, der hat mit solchen Symbolen immer große Probleme. Eine richtige Lösung gibt es nicht, man kann wohl irgendwo die Standardschriftart ändern, aber frag mich jetzt nicht, wo, denn das weiß ich nicht. -- Prince Kassad 00:14, 25. Dez. 2010 (CET)

Portal Diskussion:Unicode/Archiv/2010

Inhaltsverzeichnis

O'Connor ode O’Connor?

Broken Link

Offizielle Bezeichnung von Steuerzeichen

Was tun mit Unicode-Lemmata?

Suchfunktion

Doppelte Namensangabe in Artikeln zu Unicode-Blöcken (erl.)

Vorschlag zur einheitlichen Formatierung

Unicode-Block Verschiedene piktografische Symbole

Navigationsmenü