Portal Diskussion:Unicode/Archiv/2009

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Mal abgesehen davon, dass die Tabelle im falschen Format ist, gibt es hier ein gravierendes Problem: da auf Artikel der Wikipedia automatisch die Unicode-Normalisierung angewendet wird, erscheinen in der Tabelle die falschen Zeichen aus dem Unicode-Block Vereinheitlichte CJK-Ideogramme. Das Problem ließe sich mit einem Bild lösen, wenn ihr einverstanden damit seid. -- Prince Kassad 18:56, 2. Feb. 2009 (CET)

Was ist die Unicode-Normalisierung? Besteht das Problem darin, dass falsche Zeichenvarianten dargestellt werden? Ließe sich das nicht mit CSS lösen? Gismatis 19:08, 2. Feb. 2009 (CET)
Bei der Unicode-Normalisierung werden Zeichen, die vom Unicode-Konsortium als identisch zu anderen Zeichen betrachtet werden und nur aufgrund der Kompatibilität enthalten sind, durch ihre Entsprechungen ersetzt. So wird z. B. das griechische Fragezeichen automatisch durch das Semikolon ersetzt.
Das Problem ist hier, dass die Kompatibilitätsideogramme meist anders aussehen als ihre vereinheitlichten Varianten. Daher bekommen die Leser die falschen Zeichen zu Gesicht. (Da das ganze auf Datenbank-Level realisiert wird, ist mir keine CSS-Lösung bekannt). -- Prince Kassad 19:32, 2. Feb. 2009 (CET)
Ich hab's jetzt einfach mal durchgeführt, wem's nicht gefällt, der soll sich melden. -- Prince Kassad 15:58, 7. Feb. 2009 (CET)

Ich glaube irgendwie nicht, dass Unicode-Block Spezielles geläufiger ist als Unicode-Block Specials. Deswegen bin ich für Verschiebung+redirect zu Unicode-Block Specials. Ich lass mich aber auch gerne vom Gegenteil überzeugen ;) Gruß, s2g Quatschen? 15:16, 7. Feb. 2009 (CET)

Trifft dieses Argument nicht auch auf alle anderen Unicode-Blöcke zu? Wenn nein, wieso gerade hier? -- Prince Kassad 15:58, 7. Feb. 2009 (CET)
Na ja, ich meine geläufiger im deutschen Sprachraum. Ich bin auf keinen Fall Freund von übermäßigen Anglizismen, aber hier finde ich Specials nach meinem Sprachempfinden besser. Wenn jemand gezielt danach sucht, kann ich mir nicht wirklich vorstellen, dass dann der Suchbegriff "Unicode-Block Spezielles" lautet. Bei Tags ist das ja das selbe, oder? Wie wäre denn da die deutsche Entsprechung? Gruß, s2g Quatschen? 19:12, 7. Feb. 2009 (CET)
Tag hat keine deutsche Entsprechung (siehe Tag (Informatik)). Bei Specials wusste ich aber gar nicht, dass das im deutschen Sprachraum weit verbreitet ist (hab vorhin erst geschaut). Wenn das wirklich allgemein so bekannt ist, kriegst du von mir ein Grün für die Verschiebung. -- Prince Kassad 20:59, 7. Feb. 2009 (CET)
[...]Wenn das wirklich allgemein so bekannt ist[...]. Das genau war ja eigentlich meine Eingangsfrage! Aber ich habe jetzt doch mal in der allwissenden Müllhalde recherchiert:
Aussagekräftiger wären da doch diese und diese Anfragen, und die sprechen denke ich für sich. -- Prince Kassad 23:17, 7. Feb. 2009 (CET)
Okay. Ich mache einfach einen Redirect zu Spezielles. Gruß, s2g Quatschen? 19:15, 8. Feb. 2009 (CET)

Entspricht nicht unseren Standards. Die Tabelle sollte so aussehen wie die, die im Benutzerraum (Benutzer:Buncic/Unicode/Geometrische Formen) begonnen wurde. --Reiner Stoppok 03:38, 16. Mär. 2009 (CET) PS: Unter Benutzer:Buncic/Unicode stehen auch die noch fehlenden Blöcke. (Ist Mathematik so schwer?)

Hab die Tabelle vervollständigt. Am besten schaut noch jemand drüber. Du hast recht, Reiner, die fehlenden Blöcke sind zu lange liegen geblieben. Es gibt keine Ausrede. Ich gehe die Blöcke mal durch. Gismatis 00:02, 17. Mär. 2009 (CET)
Ich würde vorschlagen, den bisherigen Unicode-Block Geometrische Formen zu löschen und das aus dem Benutzerraum dann drauf zu verschieben. Oder gibt es andere Vorschläge? --Reiner Stoppok 18:28, 17. Mär. 2009 (CET) PS: Die eigentliche Qualitätskontrolle für die einzelnen Blöcke kommt ja erst noch ... ;-)
So habe ich es mir auch vorgestellt. Ich habe einen Schnelllöschantrag gestellt, da die Versionsgeschichte nicht erhaltenswert und aus Lizenzgründen nicht erforderlich ist, denke ich. Ups, das ging aber schnell, höchstens ein, zwei Minuten! Gismatis 11:56, 18. Mär. 2009 (CET) Nachtrag: Verschiebung vorgenommen. Die Weiterleitung ist gelöscht worden. Gismatis 12:08, 18. Mär. 2009 (CET)
„kleines bis mittelgroßes Quadrat“ gefällt mir gar nicht. Das erweckt den Eindruck, die Größe sei beliebig. Dies ist jedoch genau falsch. Die abgestuften Größen der geometrischen Formen sind für die Mathematik. Ich habe das so übersetzt: “MEDIUM SQUARE” → „mittleres Quadrat“ („mittelgroßes“ geht auch), “MEDIUM SMALL SQUARE” → „mittelkleines Quadrat“. Letzteres gibt es zwar in der deutschen Sprache nicht, etwas besseres habe ich jedoch nicht gefunden.
„Raute“ ist eine vieldeutige Bezeichnung. Deshalb habe ich mir ein eigenes Wort „Eckquadrat“ ausgedacht. Eine dreidimensionale Bezeichnung „Kantenwürfel“ ist außerhalb der Heraldik unbekannt und dort nicht immer exakt ein Quadrat bzw. 45° gedreht. Rainer Seitel 01:09, 22. Mär. 2009 (CET)
Bin nicht der Meinung, dass "kleines bis mittelgroßes Quadrat" diesen Eindruck erweckt. "mittelklein" geht jedenfalls gar nicht. Ein Zusatz in Klammer "(wörtlich: mittelklein)" wäre aber möglich. Auch "Eckquadrat" geht nicht. Wir können nicht einfach Wörter erfinden. "Raute" ist doch sehr treffend. Vielleicht wäre Karo noch besser. Das entspräche haargenau der englischen Bezeichnung. Gismatis 02:23, 23. Mär. 2009 (CET)
Wir können alles. --Reiner Stoppok 20:42, 26. Mär. 2009 (CET)

U+Hexa' nutzen...

Hallo. Tut mir Leid, ich stelle immer nur da Fragen, wo ich fast keine Ahnung habe, aber kann ich denn in Wikipedia über "Hotkeys" oder sonst wie auch alle Unicode Zeichen nutzen? Wenn etwas also den Code "U+01F0" hat, wie kann ich "hier vor meiner Tastatur" an jenes Zeichen gelangen? Gibt es eine Art Feststelltaste an die ich "01F0" einfach anhänge? Ich habe die einzelnen Artikel nur halb gelesen bzw. überflogen, wenn das schon irgendwo in Unicode oder woanders steht, freue ich mich über nen Link. Danke --WissensDürster 10:26, 15. Apr. 2009 (CEST)

Hm, Windows bietet eine solche Tastatur, aber die ist nur sehr umständlich zu aktivieren. Am einfachsten ist es, ein anderes Programm (z. B. Word) zu benutzen, und dort die Codes in die entsprechenden Unicode-Zeichen umzuwandeln. -- Prince Kassad 13:22, 15. Apr. 2009 (CEST)

Also gibt es standardmäßig keine Kombination von "ALT GR + Num-block"? Und nicht mal im Browser was integriertes? Ein simples firefox-Addon? Das kann doch nicht sein, das hier schon tausende Zeichen erst in Word erstellt wurden und dann in Wikipedia nur einkopiert? :P Grüße --WissensDürster 19:49, 15. Apr. 2009 (CEST)

Was dem gerade noch nahe kommt ist das addon Unicode Input Tool/Converter 2.5.5 - leider nur in englisch und nicht grad leicht zu durchschaun. Aber man kann sich z.B. zur Unicode-Nummer das Symbol geben lassen etc. --WissensDürster 17:39, 18. Apr. 2009 (CEST)
So viel ich weiß, kann man doch bei Windows-Rechnern (ich selbst habe Mac) alle Zeichen mit Alt + entsprechender Dezimalzahl auf dem Ziffernblock eingeben. Diese Zahl findest du in den entsprechenden Unicode-Block-Artikeln. Von dort kannst du die Zeichen ja auch einfach herauskopieren. Außerdem gibt es bei Windows irgendwo auch eine Zeichentabelle. Gismatis 22:31, 18. Apr. 2009 (CEST)
Das mit Alt+Nummer geht nur in einigen wenigen Programmen (z. B. Word) und ist daher nur bedingt hilfreich. Die Windows-Zeichentabelle sollte um Himmelswillen nicht verwendet werden, sie ist völlig veraltet. -- Prince Kassad 22:48, 18. Apr. 2009 (CEST)

"Beschreibung" von Unicode

Hallo. Mir ist aufgefallen, dass es große Lücken bei der Beschreibung von Unicode-Zeichen gibt. Beispiele: Unicode-Block Zusätzliche mathematische Operatoren oder Unicode-Block Verschiedene mathematische Symbole-A oder Unicode-Block Zusätzliche mathematische Operatoren.

Was genau gehört da rein - nur eine Übersetzung der off. engl. "Bezeichnung"? Meist ist diese ja selbsterklärend... Oder sehen diese Beschreibungen anders aus, wenn nicht würde ich selber ein paar dieser Spalten ausfüllen - will aber eben auch nichts falsch machen. Grüße --WissensDürster 14:35, 12. Apr. 2009 (CEST)

Die von dir angeführten Artikel wurden erst vorgestern eingefügt. So unfertig hätte das nicht geschehen sollen. Es wäre super, wenn du die deutschen Spalten ausfüllen könntest! Eine Übersetzung ist gut. Gismatis 18:24, 12. Apr. 2009 (CEST)
Wir hatten das bislang immer so gemacht, dass wir die erst im Benutzerraum fertiggestellt (die unfertigen stehen bei Benutzer:Buncic/Unicode) und dann in den Artikelraum verschoben hatten. In der jetzigen Form sollten die mit den Riesenlücken hier wieder gelöscht oder zurück in den Benutzerraum verschoben werden. --Reiner Stoppok 21:47, 13. Apr. 2009 (CEST) PS: Auch der Unicode-Block Zusätzliche Pfeile-B und Unicode-Block Verschiedene mathematische Symbole-B.
Das sind reine Copypaste-Artikel, die können sorglos gelöscht werden -- Prince Kassad 01:15, 14. Apr. 2009 (CEST)

Also was nun, löscht ihr die - oder soll ich die ausfüllen? Ich schreibe doch nichts, wenn ihrs wieder wegmacht.^^ Zuerst muss immer Einigkeit über das Ziel bestehn... Grüße --WissensDürster 16:10, 14. Apr. 2009 (CEST)

Wenn du die ausfüllen willst, mach das bitte auf den Unterseiten von Benutzer:Buncic/Unicode. Dort ist nämlich die Versionsgeschichte enthalten. -- Prince Kassad 20:17, 14. Apr. 2009 (CEST)

Ok danke, das ist eine Antwort. Ein Prince ein Wort =) --WissensDürster 10:12, 15. Apr. 2009 (CEST)

Na, dann kann's ja jetzt losgehen, mit Deiner Arbeit ... --Reiner Stoppok 14:50, 18. Apr. 2009 (CEST)

Dann werde ich halt jetzt mal die entsprechenden vier Löschanträge dafür stellen. --Reiner Stoppok 17:00, 23. Apr. 2009 (CEST)

Liebes Portal,

Seit heute läuft ein Meinungsbild zu portaleigenen Löschdiskussionen. Einige Portale entscheiden selbst über eigene Löschkandidaten. Die Diskussionen dazu werden im Portal selbst geführt, zum Teil in der Rubrik Löschkandidaten, oft aber auch in der Qualitätssicherung. Meist wird dazu nur ein Qualitätssicherungsbaustein im Artikel gesetzt, so dass ohne ständige Beobachtung eines bestimmten Portals man nicht mitbekommen kann, das eine Löschdiskussion läuft. Es wird auch kein allgemeiner Löschbaustein gesetzt und von der Portalseite mit einer Linkliste auf fachspezifische Löschanträge in der allgemeinen Löschdiskussion verwiesen. Dieser Zustand kann meiner Meinung nach nicht bleiben. Ich bitte euch daher an dem Meinungsbild teilzunehmen.

Gruß --source 12:36, 26. Jan. 2009 (CET)

Das Thema dürfte wohl nun erledigt sein. 77.181.46.162 16:02, 25. Aug. 2009 (CEST)

Fehler im Universal Character Set (UCS-2)

Die Aussagen im Universal Character Set UCS-2 widersprechen sich, bzw. können nicht richtig sein: Aus diesem Privatbereich hat man nun 2-mal 1024 Byte abgezweigt als sogenannte Surrogate. Es müssten doch 2-mal 1024 Zeichen, genauer gesagt 2-mal 1024 Codepoints sein und nicht Bytes.

Nimmt man nun 2 Byte aus der niederen Zone und kombiniert sie mit 2 Byte aus der höheren Zone [...] - auch eher unwahrscheinlich wenn man 2024 Byte zur Verfügung haben soll. Die High-half zone und Low-half zone sind zusammen nur 20 Bit gross, also 2,5 Byte. Für 2 mal 2 Byte reicht es nicht.

[...] so kann man den vollen Zeichencode-Bereich von UTF-16 und UTF-8 abdecken und erreicht damit den als Maximum vereinbarten CodePoint-Bereich von 0 bis 1114111. Im ersten Satz steht noch: dabei lässt sich nur die Basic Multilingual Plane kodieren. Das sind 65536 Zeichen, mehr ist rein mathematisch schon nicht möglich.

Wird der Bereich U+D800 bis U+DFFF nun von UCS-2 benutzt oder nicht und wenn ja wie?-- Wernfried 08:42, 31. Aug. 2009 (CEST)

Ich habe den ganzen Absatz entfernt. Da wurden auf ganzer Länge Fakten zusammenhanglos vermischt, bis am Ende was rauskam, was total falsch war. -- Prince Kassad 16:12, 31. Aug. 2009 (CEST)

Notenzeichen

Moin! Ich möchte den Unicode-Block Verschiedene Symbole und den Unicode-Block Notenschriftzeichen für Notenzeichen benutzen. Leider werden beim zweiten Block nur Platzhalter angezeigt.
Die auf der Seite 'Wikipedia:UTF-8-Probleme' unter 'Warum werden bei Unicode-Charakteren über U+10000 trotz installierter Schriften zwei Rechtecke angezeigt?' beschriebene Maßnahme (regedit, SURROGATE usw.) habe ich schon durchgeführt. Die Schriftart 'Arial Unicode MS Standard' ist installiert. Was fehlt? Hybscher 19:31, 1. Sep. 2009 (CEST)

Hole dir von dort die Schriftart Musical Symbols. Diese kann die Notenschriftzeichen anzeigen. -- Prince Kassad 22:46, 1. Sep. 2009 (CEST)

Achtelnoten usw. funktioniert gut. Allerdings sind die Zeichen rot, etliche andere ebenso. Einige Zeichen sind überhaupt nicht zu sehen. Jedenfalls vielen Dank. Übrigens: Freut mich, daß du wieder dabei bist. Hybscher 00:21, 2. Sep. 2009 (CEST)

Tabelle in Liste der Unicode-Blöcke aufspalten?

Ich finde, diese Riesentabelle sollte in 17 einzelne Tabellen aufgespalten werden, jeweils mit eigenen Tabellenüberschriften und Summen-Fußzeile. Dann könnte auch die redundante erste Spalte ("pl") entfallen. Was meint ihr? --RokerHRO 10:11, 16. Okt. 2009 (CEST)

Es war schon von Anfang an ein Wunsch, eine einzelne Liste zu besitzen, die den Unicode abdeckt. Nachdem der Versuch gescheitert ist, alle Blöcke auf einer einzelnen Seite unterzubringen, diente diese Liste als Kompromiss, um wenigstens noch eine Liste der Blöcke zu haben. Schon allein aufgrund der unterschiedlichen Belegung der einzelnen Teilbereiche (von 1 bis 108 Blöcke pro Teilbereich) sehe ich eine Aufteilung als wenig sinnvoll an. -- Prince Kassad 16:24, 16. Okt. 2009 (CEST)
Ein Wunsch ... von wem? Und du (oder ist das Konsens hier im Portal?) hältst so eine Monstertabelle für übersichtlicher als 17 einzelne (auf die man dann z.B. auch einzeln verlinken könnte)? :-/ Dass diese 17 Tabellen unterschiedlich groß sein werden, ist mir schon klar. So oder so bleibt die Redundanz der ersten Spalte, denn die Plane geht ja aus der Codeposition eindeutig und unmissverständlich hervor. --RokerHRO 17:43, 16. Okt. 2009 (CEST)
Sooo groß ist die Liste doch gar nicht! Ich finde eine Aufteilung völlig unnötig. Die erste Spalte könnte man durch eine unterschiedliche Hintergrundfarbe ersetzen. Andererseits nimmt sie kaum Platz weg. Gismatis 22:29, 16. Okt. 2009 (CEST)
Okay, dann will ich euren friedlichen Konsens nicht weiter stören. --RokerHRO 08:30, 17. Okt. 2009 (CEST)

Gibt es einen Grund, dass Unicode-Block Vereinheitlichte CJK-Ideogramme, Erweiterung B einen Link auf einen Blog-Beitrag von BabelStone hat, der sich mit CJK-C beschäftigt? Gehört mE nicht dort hin, sondern in den ungeschriebenen Artikel zu Vereinheitlichte CJK-Ideogramme, Erweiterung C. Übrigens ein gutes Beispiel wieso verlinken auf Blogs manchmal doch sinnvoll ist. --chrislb 12:30, 24. Okt. 2009 (CEST)

Der Grund ist, dass dieser Blog-Eintrag als Beleg für einige Aussagen in dem Text verwendet wird. -- Prince Kassad 12:54, 24. Okt. 2009 (CEST)

Evtl. verschieben nach Unicode-Block Umschlossene CJK-Zeichen und -Monatssymbole o.ä. (Vorschläge ?) --Reiner Stoppok 18:15, 20. Nov. 2009 (CET)

"Umschlossene Monate" klingt in der Tat etwas merkwürdig. Ich würde jedoch schon fast den letzten Teil ganz weglassen und den Block schlicht "Umschlossene CJK-Zeichen" nennen, das passt dann auch sehr gut zum Unicode-Block Zusätzliche umschlossene CJK-Zeichen. -- Prince Kassad 19:15, 20. Nov. 2009 (CET)
Den würde ich dann auch lieber umbenennen in Unicode-Block Zusätzliche umschlossene CJK-Zeichen und Monatssymbole (oder etwas ähnliches). Immer so dicht wie möglich am Original. --Reiner Stoppok 19:57, 20. Nov. 2009 (CET) PS: Und Telegraphsymbol in Telegrammsymbol.

Unicode U+1F000 bis U+1F02F

Hallo, kennt jemand zufälligerweise einen Font der die Range U+1F000 bis U+1F02F enthält? Sind die Mahjonggsteine. Danke, --88.130.175.26 12:14, 30. Nov. 2009 (CET)

Danke. --88.130.175.26 15:11, 30. Nov. 2009 (CET)

Mathematische Operatoren - Diskussionsseite

Wegen der Übertragung des Unicode-Block Mathematische Operatoren aus dem Buncic-BNR gab es Probleme mit der Diskussionsseite zu diesem Artikel. Wegen der Portalstruktur der Unicode-Diskussionsseite(n) ist nun diese Seite nicht mehr unmittelbar zugänglich, aber in Diskussion:Unicode-Block Mathematische Operatoren sind jederzeit über die gesamte Versionsgeschichte auch sämtliche früheren Beiträge einsehbar. -- sarang사랑 10:41, 20. Jan. 2009 (CET)

Mathematiker, die helfen wollen, finden die noch fehlenden Unicode-Blöcke hier im Benutzerraum: Zusätzliche mathematische Operatoren --Reiner Stoppok 12:38, 6. Jun. 2009 (CEST)
Wann wurde das Problem gelöst? – SimpliciusAutorengilde № 1 11:21, 9. Feb. 2012 (CET)

Kyrillisch

Ich habe gerade entdeckt, dass es im Neuen Unicode 5.2 zwei weitere kyrillische Buchstaben gibt. Ich bin noch zu unerfahren im Bearbeiten von Wikipedia und möchte nicht die Tabelle versauen und gebe sie hier in der Diskussion. Das Deutsche fehlt noch:

0524 1316 CYRILLIC CAPITAL LETTER PE WITH DESCENDER
0525 1317 CYRILLIC SMALL LETTER PE WITH DESCENDER

Quelle: Unicode 5.2: 2009. http://www.unicode.org/charts/, oder auch ftp://ftp.unicode.org/Public/5.2.0/ucd/UnicodeData.txt, (Stand 1. Oktober 2009). Hakris 11. Oktober 2009

Habe ich nun eingebaut - danke für den Hinweis! Ԥ und ԥ sind vermutlich noch nicht sichtbar. Ich habe diese Cauda ‚Abstrich‘ genannt; vielleicht nennen Typographen den descender anders (Unterlänge?) -- sarang사랑 19:23, 12. Okt. 2009 (CEST)
Der Begriff "descender" ist auch im Englischen selbst problematisch, siehe z.B. die Diskussion des Begriffes in: Nurlan Joomagueldinov et al.: Revised proposal to encode Latin letters used in the Former Soviet Union. (PDF) ISO/IEC JTC1/SC2/WG2, 29. Januar 2012, abgerufen am 10. September 2012 (englisch)., Terminologie-Einleitung und Seite 2, Abschnitt 2.1. – Die Übersetzung mit "Unterlänge" für den dort unterschiedenen "typographical descender" ist zutreffend, für den auch dort unterschiedenen "descender" als "Abstrich" halte ich letzteren sehr treffend. -- Karl432 (Diskussion) 16:30, 10. Sep. 2012 (CEST)

Erst einmal direkt aus dem Englischen übernommene Bezeichnungen für Buchstaben

Da diese ja häufig gar nicht der deutschen Lautung entsprechen - also eigentlich nicht wirklich deutsche Namen sind (die zum Beispiel vorbildlich im Unicode-Block Kyrillisch verwendet werden) - sehe ich hier den derzeit größten Arbeitsbedarf. Zu diesem Punkt müßte mal eine Mängeliste her. --Reiner Stoppok 12:38, 6. Jun. 2009 (CEST) PS: Für vieles wird es wohl auch keine deutschsprachigen Quellen geben ...

Archivierung dieses Abschnittes wurde gewünscht von: ÅñŧóñŜûŝî (Ð) 21:40, 28. Jun. 2014 (CEST)