Alphabetische Sortierung

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Eine alphabetische Sortierung ist eine Sortierung, nach der Zeichenketten nach Reihenfolge der Buchstaben im Alphabet angeordnet werden. Die herkömmliche Sortierung wird auch als initialalphabetische Sortierung bezeichnet, da die Ordnung der einzelnen Buchstaben in Schriftrichtung ermittelt wird. Bei der alphabetischen Sortierung müssen Besonderheiten wie Sonderzeichen, Diakritisches Zeichen, Leerzeichen, Groß- und Kleinschreibung sowie Ziffern beachtet werden, da sie unterschiedliche Regeln und Normen generieren.

Geschichte[Bearbeiten]

Marcus Verrius Flaccus (* um 10 v. Chr.) ordnete als Erster ein lateinisches Wörterbuch alphabetisch an. Die Suda aus der 2. Hälfte des 10. Jahrhunderts ist die erste alphabetisch angeordnete byzantinische Enzyklopädie. Der Liber de proprietatibus rerum des Bartholomaeus Anglicus aus dem 13. Jahrhundert ist ebenfalls alphabetisch geordnet und wird oft als ein Vorläufer der Enzyklopädie angesehen.

Sortierregeln nach Sprachen[Bearbeiten]

Deutsche Sprache[Bearbeiten]

DEATlastige Artikel Dieser Artikel oder Absatz stellt die Situation in Deutschland und Österreich dar. Hilf mit, die Situation in anderen Staaten zu schildern.

Einsortierungsregeln für weitere Buchstaben[Bearbeiten]

Das deutsche Alphabet ergänzt das moderne lateinische Alphabet um die Umlaute Ä, Ö und Ü, sowie den Kleinbuchstaben ß. Diese zusätzlichen Buchstaben können auf vier Arten einsortiert werden:

  1. Ignorieren der Tremata. Müll wird wie Mull sortiert.
  2. Gleichordnung von Grundbuchstaben, Doppelbuchstaben und Umlaut, wenn Doppelbuchstabe wie Umlaut gesprochen wird. Muell wird wie Müll oder Mull sortiert. Duell dagegen zwischen Duden und Dugast.
  3. Auflösung des Umlauts. Müll wird wie Muell vor Muffe sortiert.
  4. Separierung als selbständiger Buchstabe.

Für alle sonstigen (fremdsprachigen) diakritischen Zeichen gilt im deutschsprachigen Raum, dass sie einheitlich weggelassen werden; so auch alle Akzente, Tilde, Makron: é und e, ç und c, ñ und n, Č und C, ō und o sind gleich.

Deutschland[Bearbeiten]

Logo des Deutschen Instituts für Normung DIN 31638
Bereich Schriftverkehr
Titel Bibliographische Ordnungsregeln
Letzte Ausgabe 8.1994
ISO
Logo des Deutschen Instituts für Normung DIN 5007
Bereich Schriftverkehr
Titel Ordnung von Schriftzeichenfolgen
Kurzbeschreibung: Teil 1: ABC-Regeln, Teil 2: Ansetzungsregeln
Letzte Ausgabe 8.2005, 5.1996
ISO

Die deutsche Norm DIN 5007-1 beschreibt unter dem Titel „Ordnen von Schriftzeichenfolgen (ABC-Regeln)“ das Sortieren.

DIN 5007 Variante 1 (für Wörter verwendet, etwa in Lexika; Abschnitt 6.1.1.4.1)

  • ä und a sind gleich
  • ö und o sind gleich
  • ü und u sind gleich
  • ß und ss sind gleich

DIN 5007 Variante 2 (spezielle Sortierung für Namenslisten, etwa in Telefonbüchern; Abschnitt 6.1.1.4.2)

  • ä und ae sind gleich
  • ö und oe sind gleich
  • ü und ue sind gleich
  • ß und ss sind gleich

Dies berücksichtigt, dass bei Eigennamen unterschiedliche Schreibweisen möglich sind, während Begriffe in einem Lexikon oder Wörterbuch nur unter genau einer Schreibung einzutragen sind. Dagegen kann nicht erschlossen werden, ob jemand nun Moeller oder Möller heißt. Vor allem für deutschsprachige Einzelpersonen, Institutionen und Ortsnamen.

Personennamen werden in Deutschland häufig (z. B. in Telefonbüchern) in der folgenden Art und Weise alphabetisch sortiert:

  • Zuerst werden die Einträge nach Nachnamen sortiert, wobei akademische Grade wie „Prof.“, „Dr.“ und Namenszusätze „von“, „vor“, „am“, „zum“ weggelassen werden. Dabei ist zu beachten, dass Namenszusätze auch aus mehreren Wörtern bestehen können, wie etwa bei „von der Lippe“.
  • Bei identischen Nachnamen wird anschließend nach eventuell vorhandenen Namenszusätzen alphabetisch sortiert, wobei Personennamen ohne Namenszusätze immer zuerst aufgeführt werden.
  • Stimmen auch die Namenszusätze überein (oder sind keine vorhanden), wird als letztes anhand des Vornamens alphabetisch sortiert.

Diese Art der Sortierung ist in den bibliographischen Ordnungsregeln DIN 31638 geregelt.

Österreich[Bearbeiten]

Österreichische Sortierung (für Telefonbücher)

  • ä folgt auf a (kommt daher erst nach az)
  • ö folgt auf o
  • ü folgt auf u
  • ß folgt auf ss
  • St. folgt auf Sankt

Im gedruckten österreichischen Telefonbuch finden sich unterschiedliche Sortierungen: Im Ortsverzeichnis werden Umlaute und ß wie eigene Buchstaben am Ende des Alphabets einsortiert. In den Infoseiten und Gelben Seiten wird nach DIN 5007 Variante 1 sortiert. Im Namensverzeichnis wird die Österreichische Sortierung verwendet.

Beispiel für deutschsprachige Sortierungen[Bearbeiten]

DIN 5007 Var.1
(Lexikon)
DIN 5007 Var.2
(Telefonbuch)
Österreichische
Sortierung
...
Göbel
Goethe
Goldmann
Göthe
Götz
...
...
Göbel
Goethe
Göthe
Götz
Goldmann
...
...
Goethe
Goldmann
Göbel
Göthe
Götz
...

Dänische Sprache[Bearbeiten]

  • æ kommt nach z
  • ø kommt nach æ
  • å kommt nach ø

Finnische Sprache[Bearbeiten]

  • å kommt nach z
  • ä kommt nach å
  • ö kommt nach ä
  • ü und y sind gleich

Schwedische Sprache[Bearbeiten]

  • å kommt nach z
  • ä kommt nach å
  • ö kommt nach ä
  • ü und y sind gleich

Andere Sprachen[Bearbeiten]

Bei anderen Sprachen unterliegt die alphabetische Sortierung ebenfalls sprachabhängigen Zusatzregeln, die ihre Ursache in zusätzlichen Buchstaben oder speziellen Sonderregeln haben. So gibt es im Spanischen traditionell den Buchstaben Ch, der bis 1994 üblicherweise alphabetisch an anderer Stelle stand als ein C, was die Computeralgorithmen zur Sortierung vor Probleme stellte. Nach n folgt ñ. Noch kritischer wird die alphabetische Sortierung bei Sprachen wie Japanisch oder Chinesisch, die eine Vielzahl von Zeichen verwenden und deren Reihenfolge im Font (also deren Codierung) nicht der Reihenfolge einer dort üblichen Sortierung entspricht. Im Chinesischen ist zum Beispiel die Sortierung nach dem Pinyin-Äquivalent (in Computersystemen) oder nach einem System, welches sich nach dem Basissymbol und der Anzahl der Striche in Uhrzeigerrichtung richtet (in Wörterbüchern), üblich.

Computersysteme[Bearbeiten]

Computersysteme codieren die gespeicherten Zeichenketten mittels eines systemweiten oder anwendungsspezifischen Standardcodes (ASCII und seine Varianten oder Ergänzungen, seltener EBCDIC, heute immer mehr Unicode) und ordnen die Zeichen (einschließlich Ziffern, Leerzeichen, Satz- und Sonderzeichen) im einfachsten Fall nach dem zugeordneten Zahlenwert dieses Codes, sodass bspw. auch alle lateinischen Großbuchstaben vor dem kleinen „a“ eingeordnet werden. Viele Programme wenden jedoch eine von den Benutzern kulturell erwartete traditionelle Sortierung an. Dabei gibt es Möglichkeiten, auf die Sortierreihenfolge durch individuelle Kodierung oder Parametrisierung Einfluss zu nehmen. Ein möglicher Algorithmus, der dabei Anwendung findet, ist der Unicode Collation Algorithm. Die Art der Sortierung wird festgelegt durch Angabe einer sogenannten Kollation (von engl. collation ‚Sortierfolge‘) für Betriebssystemkonfigurationen und Anwendungen wie beispielsweise Datenbanksysteme.

Rückläufige Sortierung[Bearbeiten]

Die rückläufige Sortierung ist eine alphabetische Sortierung, bei der die Wörter von hinten nach vorne gelesen werden. Bei der Erstellung von Rückläufigen Wörterbüchern wird in dieser Weise sortiert, sie kann auch in Reimlexika verwendet werden.

Siehe auch[Bearbeiten]

Weblinks[Bearbeiten]