Schlagwortwolke

aus Wikipedia, der freien Enzyklopädie

(Weitergeleitet von Tagcloud)
Wechseln zu: Navigation, Suche
Schlagwortwolke aus den am häufigsten benutzten Schlagwörtern bei Flickr
Schlagwortwolke aus den am häufigsten benutzten Schlagwörtern bei Flickr

Eine Schlagwortwolke (auch: Schlagwortmatrix oder Stichwortwolke selten Etikettenwolke, englisch: tag cloud) ist eine Methode zur Informationsvisualisierung, bei der eine Liste aus Schlagworten alphabetisch sortiert flächig angezeigt wird, wobei einzelne unterschiedlich gewichtete Wörter größer oder auf andere Weise hervorgehoben dargestellt werden. Wortwolken werden zunehmend beim gemeinschaftlichen Indexieren und in Weblogs eingesetzt. Bekannte Anwendungen sind die Darstellung populärer Stichwörter bei Flickr, Technorati und Del.icio.us.

Schlagwortwolken wurden vermutlich zuerst 2002 von Jim Flanagan eingesetzt[1] und zunächst als gewichtete Liste (engl. weighted list) bezeichnet.[2] Um einige Zeit früher im Jahr 1980 kam allerdings schon das Buch „Tausend Plateaus. Kapitalismus und Schizophrenie“ von Gilles Deleuze und Felix Guattari heraus[3], auf dessen Einband bereits eine „Begriffswolke“ abgebildet ist, in welchem auch eine „rhizomatische“ Verweisstruktur von Begriffen behandelt wird[4], wie sie das Internet erst praktikabel ermöglichte.

[Bearbeiten] Erstellung einer Schlagwortwolke

Prinzipiell wird die Schriftgröße eines Schlagwortes in einer Schlagwortwolke durch dessen Häufigkeit bestimmt. Für eine Wortwolke der Kategorien eines Weblogs entspricht die Benutzungshäufigkeit beispielsweise der Anzahl von Weblog-Einträgen, die einer Kategorie zugeordnet sind. Bei kleinen Häufigkeiten genügt es, für jede Anzahl von eins bis zu einem Maximalwert die Schriftgröße direkt anzugeben.[5] Für größere Werte sollte eine Normierung vorgenommen werden. Bei einer linearen Normierung wird das Gewicht ti eines Deskriptors auf eine Größenskala von 1 bis f abgebildet, wobei tmin und tmax den Wertebereich der vorhandenen Gewichte angeben.

s_i = \left \lceil \frac{f{max}\cdot(t_i - t_{min})}{t_{max}-t_{min}} \right \rceil für ti > tmin sonst si = 1

  • si = Anzuzeigende Fontgröße
  • fmax = maximale Fontgröße
  • ti = Anzahl
  • tmin = minimale Anzahl
  • tmax = maximale Anzahl

Da die Anzahl indexierter Objekte pro Schlagwort üblicherweise nach einem Potenzgesetz verteilt ist[6], ist für größere Wertebereiche eine logarithmische Darstellung sinnvoll[7].

Für flektierende Sprachen wie das Deutsche müssen die Worte vor dem Zählen zuerst lemmatisiert also auf ihre Grundform reduziert werden.

[Bearbeiten] Quellen

  1. Jim Flanagan: Search Engine Referrals. In: Everything Burns. 6.9.2002 (Stand: 17.5.2006).
  2. Matthew Linderman (Hrsg.): The Spread of Weighted Lists. In: Signal vs Noise. 2.12.2004 (Stand: 17.5.2006).
  3. Gilles Deleuze u. Felix Guattari: Tausend Plateaus. Kapitalismus und Schizophrenie. 1992 (Stand: 03.7.2007).
  4. Wikipedia: Rhizom. (Stand: 03.7.2007).
  5. Ed Kohler: How to Make a Tag Cloud for Movable Type Blogs. In: technologyevangelist.com. 8.3.2006 (Stand: 14.5.2006).
  6. Jakob Voss: Collaborative thesaurus tagging the Wikipedia way. April 2006 [1]
  7. kentbye: Tag Cloud Font Distribution Algorithm. In: kentbye's blog. 2005-06-24 (Stand: 17.5.2004).
Persönliche Werkzeuge