Benutzer:Ulrich.fuchs/Wikipedia ist keine Datenbank

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Bevor Ihr über mich herfallt, lasst mich erstmal zu Ende schreiben bzw. zu Ende zusammenkopieren! Uli 19:01, 23. Sep 2003 (CEST)
Wann ist es denn nun fertig? Heizer 19:59, 26. Sep 2003 (CEST)

Menno, irgendwann muss ich auch mal arbeiten und Geld verdienen für meine Online-Gebühren. Hab Geduld, mein Junge! Aber ihr könnt ja in der Diskussion schon mal loslegen -- Uli 21:26, 26. Sep 2003 (CEST)

Wikipedia ist keine Datenbank, und zwar aus drei Gründen: Erstens ist Wikipedia eine Enzyklopädie, zweitens ist Wikipedia ein Wiki - und drittens ist sie das in genau dieser Reihenfolge. Die Wiki-Technologie ist Mittel zum Zweck (und legt, wie wir später sehen werden, dem Zweck Grenzen auf), sie ist nicht Selbstzweck, wie bei anderen Wikis.

Zwei Irrglauben sind unter Wikipedianern stark verbreitet. Der eine ist, Wikipedia könne irgendwann einmal das "Gesamte Wissen der Menschheit" speichern, der andere ist, Wikipedia habe nicht die Einschränkungen papierener Enzyklopädien, könne daher also jedes beliebige Stichwort als Artikel aufnehmen, was dann im ziemlich unsinnigen 1 Slogan "Wiki ist not paper" gipfelt.

Den ersteren Irrgläubigen seien zwei Dinge gesagt: Dass es nämlich erstens prinzipiell unmöglich ist, eine Karte der Welt im Maßstab 1:1 (Eco) zu erstellen, denn diese Karte müsste notwendigerweise die Welt selber sein, und sich daher auch noch selber enthalten, was zu einer unendlichen Rekursion führte. Und dass zweitens, nicht alles, was eine Information darstellt, auch Wissen der Menschheit ist. Verabschieden wir uns also davon, das Wissen der Menschheit aufführen zu können, und einigen uns darauf, eine Auswahl des Wissens der Menschheit aufführen zu wollen. Dann stellt sich nur noch die Frage, wie wir auswählen - sowohl inhaltlich, wie von der Methode her.

Den zweiten Irrgläubigen ist etwas schwerer beizukommen. Auch ihnen sei zunächst noch einmal vor Augen gehalten, dass nicht jede Information auch Wissen ist - von Wissen der Menschheit oder enzyklopädischem Wissen ganz zu schweigen. Wo aber liegen die Grenzen? Und warum kann man nicht einfach alles unter jedem Artikelnamen aufnehmen?

Vier Fragen stellen sich:

  • Wann ist ein Inhalt Wissen?
  • Wann ist er enzyklopädisches Wissen, das in der Wikipedia stehen sollte?
  • Warum sollte die Wikipedia nur enzyklopädisches Wissen enthalten?
  • Und unter welchem Artikelnamen sollte dieses enzyklopädische Wissen erscheinen?

Begriffe, nicht Dinge

Eine "normale" Enzyclopädie erklärt Begriffe, sie listet nicht Gegenstände auf. Begriffe sind aber in aller Regel Abstrakta. Eine Enzylopädie erklärt also, was eine Schraube (ein Begriff) ist, aber sie erklärt nicht, was die Schraube an der hinteren linken Bremsbacke am Fahrrad von Ulrich Fuchs (ein Gegenstand) ist.

Eine Enzyklopädie unterscheidet sich also grundsätzlich von z.B. einem Auktionskatalog. Sie erklärt zwar, was eine Hellebarde ist, aber sie führt nicht 200 einzelne Hellebarden auf, mit einer Beschreibung, was an der jeweiligen Hellebarde nun das interessante ist. Das ist Aufgabe spezieller Verzeichnisse von Gegenständen bzw. Dingen. Anders ausgedrückt: Begriffe gibt es ein paar Millionen, die Dinge auf dieser Welt jedoch sind Legion.

Eine Ausnahme besteht immer dann, wenn ein bestimmter Gegenstand allgemein so wichtig geworden ist, dass er im Grunde einen eigenen Begriff darstellen. Das sind also Dinge, die man kennen sollte.

Artikelnamen sind die Primärschlüssel

Die Wikipedia ist ein Wiki. Das heißt, alle Artikel sind unter ihrem Namen abgelegt. Es können keine zwei Artikel den selben Namen haben.

Das ist anders, als spezialisierte Datenbanken aufgebaut sind. In einer Musikdatenbank etwa würde ein Eintrag unter einem eindeutigen Schlüssel (z.B. "767871323") auch, aber nicht nur mit einem beschreibenden Namen aufzufinden sein. Die Aufnahme, die Frank Sinatra vielleicht von As time goes by gemacht hätte, würde in einer Datenbank also folgendermaßen abgelegt sein: Titel: As Time Goes By / Hauptkünstler: Frank Sinatra / Aufnahmedatum: 30.4.1960. Das wären drei einzelne Felder, die den Artikel eindeutig machen. So lassen sich aus der Datenbank zum Beispiel alle Stücke heraussuchen, die Frank Sinatra aufgenommen hat, und es kann mehrere Stücke geben, die As time goes by heißen.

In der Wikipedia ist das anders. Hier muss alles, was einen Artikel eindeutig klassifiziert, in den Artikelnamen hineingepackt werden.

Wollten wir also zum Beispiel alle Songs aller Interpreten haben, so müssten wir den Artikel As time goes by in zig Versionen haben, weil ihn zig Leute gesungen haben. Wir hätten also neben As time goes by (Film) (die Fortsetzung von Casablana) noch As time goes by (Musik, Dooley Wilson) (die Filmmusik), As time goes by (Musik, Frank Sinatra), As Time Goes by (Musik, Frank Sinatra, spätere Aufnahme), As Time Goes by (Musik, Frank Sinatra, spätere Aufnahme, remix von 1999) etc.. und der Trompeter, der beim letzten mitgespielt hat, hat eben nicht mehr As time goes by aufgenommen, sondern As Time Goes by (Musik, Frank Sinatra, spätere Aufnahme, remix von 1999). Und genau da liegen die Probleme, weil das kein Mensch mehr vernünftig verlinken kann.

Ein anderes Beispiel sind Rezepte. Auch hier werden wir Schwierigkeiten bekommen, wenn wir zum Beispiel Rezepte vernünftig zugänglich aufnehmen wollten. Mit einem Artikelnamen Roulade vom Flugentenbrüstchen in Sahnesoße an Spaghettigratin auf Balsamico-Rosenkohldressing wird jeder, der ihn verwenden soll, wahnsinnig, und was machen wir, wenn noch ein zweites Rezept kommt, das auch Roulade vom Flugentenbrüstchen in Sahnesoße an Spaghettigratin auf Balsamico-Rosenkohldressing beschreibt, aber etwas weniger Balsamico verwendet. Nennen wir den Artikel dann Roulade vom Flugentenbrüstchen in Sahnesoße an Spaghettigratin auf Balsamico-Rosenkohldressing mit etwas weniger Balsamico als bei "Roulade vom Flugentenbrüstchen in Sahnesoße an Spaghettigratin auf Balsamico-Rosenkohldressing"?

Deshalb können wir nicht alle Filme, Musikstücke, Rezepte, Ameisenarten, Herr-der-Ringe-Figuren, Unix-Kommandos, Ikea-Artikel etc. aufnehmen, wir müssen auswählen, welche einen eigenen Artikel bekommen.

Es ist unser altes "Begriffe" - Problem: Eine "normale" Enzyclopädie erklärt Begriffe, sie listet nicht Gegenstände auf. Ein Begriff, ein Name, im Notfall eine Begriffsklärung. Nehmen wir aber alle Filme etc. auf, dann haben wir auf einmal zu wenig Begriffe um sie alle zu benennen und müssen uns (siehe das Beispiel mit As Time goes by oben) so fürchterlich verbiegen, dass wir das organisatorisch nicht mehr hinkriegen werden.

Nicht jede Information ist Wissen

Die Frage ist, wie wir unsere Artikel enzyclopädisch strukturieren. Beispiel: Brauchen wir für alle drei Herr-der-Ringe-Filme jeweils einen eigenen Artikel, oder ist es nichtvielmehr sinnvoll, die im Zusammenhang in einem Artikel aufzuführen? Müssen wir für jede Star-Trek-Folge einen eigenen Artikel haben, oder ist es nicht sinnvoller, in einem Artikel das wesentliche zur Serie aufzuarbeiten, statt in zig Artikeln Inhaltsangaben abzuliefern? Genau darum geht es, wenn von Datenbankeinträgen die Rede ist: Unsere Aufgabe sollte es sein, dass sich der Leser mit der Wikipedia einen Einblick in die Filmwelt erarbeiten kann, nicht so sehr die, Inhaltsangaben zu Filmen zu liefern. Es darf uns nicht darum gehen, zu erzählen, was in Außer Atem passiert, sondern warum das passiert, was der Film bewirkt hat, was das besondere an der Filmsprache ist etc. Im enzyclopädischen Sinn sind diese wichtigen Informationen dann aber meist besser unter Nouvelle Vague oder Jean-Luc Godard aufgehoben. Diese beiden Artikel aber sind heute (Stand 2003) traurig dürftig. Dabei könnte hier so viel zu den Filmen gesagt werden. Es geht also darum, dass wir uns nicht im Verlinken von Autoren/Filmen/Schauspielern verzetteln (das können wir nicht ordentlich genug machen, siehe oben), sondern uns immer wieder in Erinnerung rufen, was der Kern der Dinge ist, die wir beschreiben. Zu viele Artikel zu zu vielen Einzelaspekten lassen uns zu leicht vergessen, wo der Kern ist - wir sehen auf einmal den Wald vor lauter Bäumen nicht mehr.

Verwässerung

Eine Enzyklopädie ist eine Zusammenstellung von Wissen. Wichtig ist, dass sie so strukturiert werden muss, dass man das Wissen auch wiederfindet. Wir haben hier im Internet im Grunde zwei Methoden, mit dem man die Information wiederfindet. Das eine ist die alphabetische Strukturierung, das andere die Suchmaschine (wenn sie mal funktioniert).

Klassische Papierenzyklopädien haben nur eine Methode: Die alphabetische Sortierung. Und die reicht ihnen völlig aus, weil es bestimmte "naheliegende" Stichworte gibt, unter denen man zu einem Thema nachschlägt. Wenn ich also in einer Papierenzyklopädie was zur Bach-Kantante "Liebster Gott, wenn werd ich sterben?" suche, schlage ich nicht unter "L" nach, sondern unter "B", wie Bach, Johann Sebastian, und wenn die Enzylopädie gut ist, finde ich da genau das, was ich brauche.

Wir hier laufen Gefahr, die Kantate unter einem eigenen Artikel aufzunehmen. Mit dem Erfolg, dass wir sie unter Bach verlinken müssen, weil die Benutzer sie dort suchen werden. Und mit dem Nebeneffekt, dass das Stichwort "Johann Sebastian Bach" nicht mehr nur im Artikel zu Bach und vielleicht von den Leuten etc. auftaucht, mit denen er was zu tun hatte, sondern auf nun auf einmal in 231 Artikeln zu Kantanten. Wenn wir das Weiterdenken, kommt das Stichwort auch in zig Artikeln zu den einzelnen Aufnahmen (manche wollen ja zu jeder Platte der Welt einen Artikel haben) von Jacques Loussiers "Play Bach"-Schaffen vor. Und in jeder Straße (für die wir auch eigene Artikel haben wollen), durch die Bach mal durchgelaufen ist.

Und der Erfolg der Geschichte: Man findet gar nichts mehr, wenn man nun mit einer Suchmaschine oder dem "Was linkt hierhin"-Feature nach "Johann Sebastian Bach" sucht. Den Hauptartikel vielleicht noch, ok. Alles andere geht im Rauschen unter.

Wir laufen dann in das Problem das das Web heute schon hat: Das Wissen versinkt unter den vielen Einzelinformationen - man sieht den Wald vor lauter Bäumen nicht mehr. Wir sollten vermeiden, dass die Wikipedia irgendwann ähnlich unstrukturiert und chaotisch wird wie das Web als ganzes, dessen Möglichkeit, Wissen abrufbar zu machen, mittlerweile ziemlich begrenzt ist und sich nur noch mit hochspezialisierten Suchmaschinen und einer lange Übung erfordernden Suchtechnik beherrschen lassen.

Wie schön ist dagegen doch eine richtige Enzyklopädie zu bedienen. Ein bisschen Übung, und man findet das Wissen. Das sollten wir doch eigentlich hier auch leisten: Dem Leser keine Einzelinformationen vorzuknallen, sondern Zusammenhänge strukturiert, kurz und knapp zu erläutern und sie ihm vor allem dort zu präsentieren, wo er sie mit einiger Wahrscheinlichkeit suchen wird.

Überlegen wir uns also, wo unsere Informationen gut untergebracht sind, und machen wir es uns nicht so einfach, für jedes Ding, das uns in den Sinn kommt, jedes Buch und jeden Film etc. einen neuen Artikel anzulegen und es dem Leser zu überlassen, die alle erstmal zu finden und dann in einen Kontext zu bringen. Der Kontext ist unsere Aufgabe, nicht die Einzeldaten. Konzentrieren wir uns auf das, was wir am Besten können: Texte produzieren, nicht Daten.



1) weil Schreibmethode und Speicher/Präsentationsmedium miteinander verglichen werden, das sind Äpfel und Birnen.