Schlagwortwolke

aus Wikipedia, der freien Enzyklopädie
(Weitergeleitet von Tagcloud)
Wechseln zu: Navigation, Suche
Schlagwortwolke ohne alphabetische Sortierung zum Thema Web 2.0

Eine Schlagwortwolke (auch Wortwolke, Schlagwortmatrix oder Stichwortwolke, selten Etikettenwolke; engl.: tag cloud, word cloud) ist eine Methode zur Informationsvisualisierung, bei der eine Liste aus Schlagworten, oft alphabetisch sortiert, flächig angezeigt wird, wobei einzelne unterschiedlich gewichtete Wörter größer oder auf andere Weise hervorgehoben dargestellt werden. Sie kann so zwei Ordnungsdimensionen (die alphabetische Sortierung und die Gewichtung) gleichzeitig darstellen und auf einen Blick erfassbar machen.

Wortwolken werden zunehmend beim gemeinschaftlichen Indexieren und in Weblogs eingesetzt. Bekannte Anwendungen sind die Darstellung populärer Stichwörter bei Flickr, Technorati und Del.icio.us.

Schlagwortwolken wurden vermutlich zuerst 2002 von Jim Flanagan eingesetzt[1] und zunächst als gewichtete Liste (engl. weighted list) bezeichnet.[2] Um einige Zeit früher im Jahr 1992 kam allerdings schon das Buch „Tausend Plateaus. Kapitalismus und Schizophrenie“ von Gilles Deleuze und Felix Guattari heraus[3], auf dessen Einband bereits eine „Begriffswolke“ abgebildet ist.

Erstellung[Bearbeiten]

Prinzipiell wird die Schriftgröße eines Schlagwortes in einer Schlagwortwolke durch dessen Häufigkeit bestimmt. Für eine Wortwolke der Kategorien eines Weblogs entspricht die Benutzungshäufigkeit beispielsweise der Anzahl von Weblog-Einträgen, die einer Kategorie zugeordnet sind. Bei kleinen Häufigkeiten genügt es, für jede Anzahl von eins bis zu einem Maximalwert die Schriftgröße direkt anzugeben.[4] Für größere Werte sollte eine Normierung vorgenommen werden. Bei einer linearen Normierung wird das Gewicht t_i eines Deskriptors auf eine Größenskala von f_{\mathrm{min}} bis f_{\mathrm{max}} abgebildet, wobei t_{\mathrm{min}} und t_{\mathrm{max}} den Wertebereich der vorhandenen Gewichte angeben.

s_i = \left \lceil (f_{\mathrm{max}} - f_{\mathrm{min}})\cdot \frac{ t_i-t_{\mathrm{min}} }{ t_{\mathrm{max}}-t_{\mathrm{min}} } + f_{\mathrm{min}} \right \rceil

  • s_i: anzuzeigende Schriftgröße
  • f_{\mathrm{max}}: maximale Schriftgröße
  • f_{\mathrm{min}}: minimale Schriftgröße
  • t_i: Häufigkeit des betreffenden Schlagwortes
  • t_{\mathrm{min}}: Häufigkeit, ab der ein Schlagwort angezeigt werden soll
  • t_{\mathrm{max}}: Häufigkeit des häufigsten Schlagwortes

Da die Anzahl indexierter Objekte pro Schlagwort üblicherweise nach einem Potenzgesetz verteilt ist[5], ist für größere Wertebereiche eine logarithmische Darstellung sinnvoll.[6] Für flektierende Sprachen wie das Deutsche müssen die Wörter vor dem Zählen zuerst lemmatisiert, also auf ihre Grundform reduziert werden.

Für die Erstellung von Schlagwortwolken verwendet man üblicherweise speziell dafür geeignete Software. So gibt es beispielsweise Software, welche aus Texten oder Webseiten die Schlagworte und deren Häufigkeit automatisch eruieren und die Schlagwortwolke generieren.[7] Andere Programme wiederum benötigen eine Liste an Schlagworten und deren Gewicht um die Schlagwortwolke generieren zu können.

Wahrnehmung[Bearbeiten]

In einigen empirischen Usability-Tests wurde die Wahrnehmung und Wirkung von Schlagwortwolken untersucht. Dabei wurde festgestellt, dass Schlagwörter, die die folgenden Eigenschaften besitzen, mehr Beachtung erfahren:[8]

  • Schlagwörter mit einer großen Schriftgröße (Effekt beeinflusst durch weitere Faktoren, wie Anzahl der Buchstaben oder benachbarte Schlagwörter)
  • Schlagwörter in der Mitte der Schlagwortwolke (Effekt beeinflusst durch das jeweilige Layout der Schlagwortwolke)
  • Schlagwörter im linken, oberen Quadranten (Effekt beeinflusst durch westliche Lesegewohnheiten)

Benutzerfreundlichkeit[Bearbeiten]

Im Rahmen von Tests hinsichtlich der Benutzerfreundlichkeit ist festgestellt worden, dass wenig erfahrene Nutzer häufig Probleme mit Wortwolken haben: User-Tests und die Nachbefragungen haben ergeben, dass sich Schlagwortwolken vielen Usern offenbar nicht intuitiv erschließen und ihnen unklar ist, warum z. B. manche Begriffe größer als andere dargestellt werden.

Als ein weiterer Mangel in Bezug auf die Benutzerfreundlichkeit wird wahrgenommen, dass die Schlagwortwolken gar nicht oder allenfalls alphabetisch geordnet sind. Eine Studie hat gezeigt, dass Nutzerinnen und Nutzer die Wolken nach semantischen Assoziationen ordnen würden. Das heißt, sie würden Begriffe der Wolke, die sich einem gemeinsamen Thema zuordnen lassen, in Untergruppen zusammenstellen.[9]

Internet-erfahrene Nutzer dagegen können Wortwolken in der Regel problemlos handhaben und sehen in ihnen häufig eine Bereicherung des Nutzererlebnisses.

Quellen[Bearbeiten]

  1. Vorlage:Internetquelle/Wartung/Zugriffsdatum nicht im ISO-FormatVorlage:Internetquelle/Wartung/Datum nicht im ISO-FormatJim Flanagan: Search Engine Referrals. In: Everything Burns. 6. September 2002, abgerufen am 17. Mai 2006.
  2. Vorlage:Internetquelle/Wartung/Zugriffsdatum nicht im ISO-FormatVorlage:Internetquelle/Wartung/Datum nicht im ISO-FormatThe Spread of Weighted Lists. In: Signal vs Noise. Matthew Linderman, 2. Dezember 2004, abgerufen am 17. Mai 2006.
  3.  Gilles Deleuze, Felix Guattari: Tausend Plateaus. Kapitalismus und Schizophrenie. Berlin 1992, ISBN 978-3-88396-094-4.
  4. Vorlage:Internetquelle/Wartung/Zugriffsdatum nicht im ISO-FormatVorlage:Internetquelle/Wartung/Datum nicht im ISO-FormatEd Kohler: How to Make a Tag Cloud for Movable Type Blogs. In: technologyevangelist.com. 8. März 2006, abgerufen am 14. Mai 2006.
  5. Jakob Voss: Collaborative thesaurus tagging the Wikipedia way. April 2006 [1]
  6. Vorlage:Internetquelle/Wartung/Zugriffsdatum nicht im ISO-Formatkentbye: Tag Cloud Font Distribution Algorithm. In: kentbye's blog. 24. Juni 2005, abgerufen am 17. Mai 2004.
  7. Wordle
  8. Steffen Lohmann, Jürgen Ziegler, Lena Tetzlaff: Comparison of Tag Cloud Layouts: Task-Related Performance and Visual Exploration (PDF; 521 kB), In: T. Gross et al. (Eds.): INTERACT 2009, Part I, LNCS 5726, S. 392–404, 2009.
  9. Daniela Oelke, Iryna Gurevych: [https://www.ukp.tu-darmstadt.de/fileadmin/user_upload/Group_UKP/publikationen/2014/StructuredTagClouds_CAMERA-READY.pdf A Study on Human-Generated Tag Structures to Inform Tag Cloud Layout] (PDF; 3450 kB), In: Proceedings of the International Working Conference on Advanced Visual Interfaces (AVI 2014), 2014.