Benutzer:Blunt./etwas statistik

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen


inhalt 2010 – Top250 Vandalen, sperrprüfungstopten 2009 – onemilli, wahlbeteiligung, Löschargument, Schiedsgerichtskandidaten, was bringt „Was geschah am …?“ auf der hauptseite einem gelisteten artikel?, was bringt „schon gewusst“ auf der hauptseite einem gelisteten artikel?, was bringt der hinweis zusammenfassung und quellen anzugeben?



etwas statistik – Top250 Vandalen


10. August

Nach dem ich hier letztens^^ die Top-Sperrprüfer behandelt habe, entdeckte ich heute eine tolle Statistik über die Benutzer, die am meisten auf VM gemeldet wurden.[1] In der Top 250 bin ich auf Platz 203 (8 Meldungen, mit „.“ am Ende) und 209 (7 Meldungen, mit „s“ am Ende). Toll, und wenn man die Meldungen zusammenrechnet käme ich auf 15 Meldungen, was irgendwo zwischen Platz 82 und 87 liegt. Genau da fängt dann auch das Problem an, weil die Auswertung Benutzern mit der gleichen Anzahl an Meldungen nicht einen gemeinsamen Platz in der Rangfolge zu weist, sondern die Benutzer willkürlich ordnet, ist die Tabelle recht aussagelos. Also hab ich mir die Mühe gemacht die gemeinsamen Plätze auszurechnen und lande auf Platz 38 von 47 (respektive 46 für den Punkt und 45 für das S).

Wie lässt sich dieses Ergebnis bewerten? Hm, die 15 Meldungen führten bei mir zu keiner Sperre (meine einzige Sperre kam aus einer Artikelmeldung, außerdem war sie völlig willkürlich, missbräuchlich, falsch und…). Ok, ein Problembenutzer auf Platz 28 würde jetzt sagen „Eine Krähe hackt der anderen kein Auge aus“, aber mal von solchen intellektuell sehr einfachen Erklärungsmustern abgesehen, liegt hier eher der Schluss nahe, dass sich nicht alle Sachverhalte sinnvoll statistisch abbilden lassen, oder dass die maschinelle Auswertung von Archiven sehr complexist. Trotzdem Danke für die Inspiration.


  1. Benutzer:Inkowik/vmScore (aus Datenschutzgründen wieder gelöscht…)


etwas statistik – sperrprüfungstopten


Top Ten
Papphase 222
Die Winterreise 153
Widescreen 138
Hardenacke 122
Bwag 91
Amberg 74 Admin
SDB 55
Leithian 54 Admin
Cymothoa exigua 53 Admin
TJ.MD 51

8. Februar

Nein, hier kommt nicht eine Liste der meist sperrgeprüften Benutzer, sondern die Top Ten der sperrprüfenden Benutzer. Grundgedanke der Sperrprüfung ist, dass administrativ verhängte Sperren durch andere Administratoren geprüft werden und – im Falle, dass sie ungerechtfertigt sind – aufgehoben oder verkürzt werden. Begleiterscheinung ist, dass Konflikte über die Artikel/Diskussionsseiten mit einem Zwischenstopp auf WP:VM letztlich auf die Sperrprüfung wandern.

Ausgewertet werden dafür die Versionsgeschichten der Sperrprüfung seit dem 4. August 2009 bis heute.[1] Dabei ist zu beachten, dass die Gesperrten selbst nicht oder nur in geringem Umfang auftauchen werden, da sie zur Zeit der Sperre üblicherweise nicht über ihr Konto verfügten, also per IP oder SP-Socke editierten. Methodisch ist das Vorgehen nicht ganz sauber, da lediglich die Anzahl der Beiträge erhoben wird ohne zu berücksichtigen, ob es sich um wirkliche Beiträge oder Typo-Korrekturen handelt.[2] Eine qualitative Auswertung der Diskussionsbeiträge findet nicht statt.

Unter den Sperrprüfenden sollten sich eine Menge Admins und engagierte Benutzer aber auch Konfliktparteien aus dem Umfeld der geprüften Sperren. Insbesondere bei Langzeitkonflikten treffen immer wieder die gleichen Gruppen auf der Sperrprüfung aufeinander. Ohne näher darauf einzugehen wäre eine Untersuchung der Korrelation zwischen SP-Beiträgen und der Anzahl der Sperrlog-Einträge sicherlich interessant.

Es zeigt sich, dass unter den Top Ten lediglich drei Admins zu finden sind. Andere engagierte Benutzer dominieren. Wenn man zusätzlich die Beiträge bei Prüfungen eigener Sperren berücksichtigen würde, käme es zu einer Verschiebung der Rangfolge – hier nur exemplarisch an den ersten beiden Benutzern gezeigt: Dem Zweitplatzierten lassen sich noch über 150 Beiträge per IP zuordnen, so dass er die Führung übernehmen würde.


  1. Beschränkung ergibt sich aus der aktuellen Versionsgeschichte und des letzten Versionsarchivs
  2. Bearbeitungsstatistik-Tool



2009

etwas statistik – onemilli


27. Dezember

Ich geb es von vorne herein zu, diesmal wird es etwas lahm. Seit meinem ersten Beitrag am 14. August 2007 sind 866 Tage vergangen. Davon war ich 773 aktiv, aber egal. Am 17. August 2007 hatte Wikipedia 625.000 Artikel und heute 1.000.000 Artikel.[1] Das entspricht 433 neuen Artikel am Tag seit 2007 – klingt erstmal nicht an Krise.

Nun bin ich ja einer der aktiveren Wikipedianer gewesen. Trotzdem liegt mein Anteil an der Steigerung bei nur 0,051 Prozent, also quasi 0. Ich denke das sollte man sich immer wieder vor Augen halten: Die eigene Arbeit mag gut und umfangreich sein – was ich von meiner nicht behaupten will – aber ist im Vergleich zur Arbeit der gesamten Gemeinschaft irrelevant.


  1. WP:ME



etwas statistik – wahlbeteiligung


14. August

Immer wieder kommt bei der Diskussion zur Frage „Ist Wikipedia eine Demokratie?“ das Argument, dass wir zumindest in Sach- und Personalfragen demokratisch vorgehen und das mittels einer allgemeinen und freien Wahl machen. Nur, ist das wirklich so? Prinzipiell kann jeder, der mit 200 Artikelbeiträgen und zwei Monaten Mitgliedschaft die Stimmberechtigung erlangt an Wahlen teilnehmen. Das heißt also, es gibt eine Zugangshürde, die zumindest einfacher zu überwinden ist als eventuelle Staatsangehörigkeitsprobleme. Im Gegensatz zu politischen Wahlen, geht es bei uns auch meist nicht um die einfache Mehrheit, wir verlangen fast immer eine Zwei-Drittel-Mehrheit. Unsere Wahlen sollten – wenn sie als demokratisch legitimierend angesehen werden sollen – über einen gewissen Rückhalt, sprich eine ausreichende Beteiligung, verfügen.

Zuerst müsste dazu geklärt werden wie groß das „Wahlvolk“ überhaupt ist. Von 807.199[1] angemeldeten Benutzern erfüllen 10.977[2] die Kriterien der Stimmberechtigung. Das entspricht einem Anteil von 1,3 Prozent. Als nächstes stellt sich die Frage wie viele dieser Stimmberechtigten sich überhaupt an den Wahlen beteiligen. Um das zu ermitteln, wurden die 42 Adminwahlen bis zum 2. August 2009 ausgewertet.[3] Durchschnittlich stimmten 232,4 Wähler ab.[4] Damit liegt die mittlere Wahlbeteiligung bei Adminkandidaturen im ersten Halbjahr 2009 bei 2,2 Prozent.[5] Um es mit anderen Worten zu sagen: Jeder Abstimmenden hat für 48 andere abgestimmt. Nach demokratietheoretischen Kriterien ein Diaster. Selbst die drei beteiligungsstärksten Wahlen[6] kommen nicht über eine Wahlbeteiligung von über 4,3 Prozent.

Mit so geringen Wahlbeteiligungen kann nicht von allgemeinen Wahlen gesprochen werden. Es stimmt nur ein gewisses, aktives Klientel ab. Inaktive und an Meta uninteressierte Wahlberechtigte (es gibt immerhin 23.217 aktive Benutzer)[1] stellen die Mehrheit da. Wenn man noch bedenkt, dass zusätzlich der demokratische Grundsatz der geheimen Wahl (Man denke an Gruppendynamiken) nicht erfüllt ist, wird recht deutlich, dass wir keine demokratischen Wahlen abhalten, eher eine auf den Zeitpunkt bezogene Elitenabstimmung.[7]

Bei der niedrigen Wahlbeteiligung bleibt zu bedenken, dass Wikipedia als freiwilligen Projekt für viele Nutzer nur für eine begrenzte Zeit eine Rolle spielt. Anschließend wenden sich viele anderen Dingen zu, bleiben aber stimmberechtigt. Daher ist schon aus systematischen Gründen nicht mit einer sonderlich hohen Wahlbeteiligung zu rechnen. Eine Erwähnung in der SiteNotice, wie beim MB Weiterführung der gesichteten Versionen (mit 1189 Stimmen eine außergewöhnlich hohe Beteiligung) wirkt sich positiv auf die Wahlbeteiligung aus.

Wahrscheinlich müssen wir uns einfach damit abfinden, dass Wikipedia keine Demokratie ist, sondern einer Diktatur der aktiven Elite bleibt. Für das Projektziel – Erstellung einer Enzyklopädie – ist das egal, denn da geht es um Artikelarbeit.


  1. a b Spezial:Statistik am 14. August 2009
  2. Ermittelt per API-Abfrage am 14. August 2009 von Benutzer:Umherirrender. Enthält auch die mindestens 381 unbeschränkt gesperrten Stimmberechtigten, sowie alle freiwillig gesperrten (die ihre Stimmberechtigung behalten)
  3. Archivstand am 14. August: Die zwei auf Wunsch der Kandidaten abgebrochenen Wahlen werden nicht berücksichtigt, da sie das Ergebnis verzerren würden.
  4. Zusammengefasst aus Pro, Contra und Enthaltung. Bei den sechs Wiederwahlen lag der Schnitt mit 223,8 geringfügig niedriger.
  5. Angenommen wurden (nach Abzug der Gesperrten) 10.600 Wahlberechtigte. Das ist statistisch nicht ganz sauber, da es zu Anfang des Untersuchungszeitraums weniger Stimmberechtigte gab. Diese Ungenauigkeit spielt für das Endergebnis kaum eine Rolle, da sich auch bei angenommen 10.000 Wahlberechtigen der Wert nur um 0,1 verschiebt.
  6. Weissbier (458 Stimmen, nicht erfolgreich), Brummfuss (356, nicht erfolgreich) und Kriddl (289, erfolgreiche Wiederwahl)
  7. Mit Elite sind aktive Benutzer mit Kenntnissen des Systems gemeint, unabhängig von Benutzergruppen oder Rechten.



heute mal keine statistik – Exkurs: Löschargument


1. Juli

Wer kennt das nicht: In einer Löschdiskussion/-prüfung zu einer Softwareklitsche mit drei Mitarbeitern kommt vom „Vorstand“ oder einer Socke das Argument: „Dann müsste auch Microsoft und SAP gelöscht werden!“ Dass das kein Argument ist, sollte klar sein. Ich hab mich da immer gefragt: Was passiert wenn wir jetzt wirklich Microsoft löschen? Wird der Vorstand dann klein beigeben und seinen Werbeversuch einstellen?

Heute hatte gab es die seltene Situation den Vergleichsartikel schnelllöschen zu können: In der Löschprüfung zur Fernsehserie „V“ kam nach dem Hinweis auf die WP:RK[1] die Aufforderung: „Dann löscht auch den Artikel zu Stargate Universe, zu der weiß Gott weniger bekannt ist als zu V…“ Nichts leichter als das. Also gegen Stargate Universe einen SLA gestellt, der schnell ausgeführt wurde, und dann gespannt gewartet was passiert. Oh, Wunder! Keine Spur von Verständnis oder Dankbarkeit, nein: „Wie lächerlich das mal einfach is … das mit SGU war einfach nurn Vergleich und keine Aufforderung es zu löschen!!!“ Aha, aber wir haben doch gemacht, was du wolltest und jetzt bist du nicht zu frieden? Scheinbar nicht, den weiter ging es mit WP:RK-Bashing „so wie es jetzt ist, ist es einfach nicht länger tragbar

Leider war der Effekt nicht wie erhofft.

PS: Noch etwas Statistik zum Schluss: Stargate Universe wurde heute zum 21. Mal gelöscht und ist auf Platz 47 der meist gelöschten Lemma.[2]


  1. Der Antrag und die erste Antwort
  2. Wikipedia:Beitragszahlen/Seitenlöschungen#Am häufigsten gelöschte Artikel


etwas statistik – Schiedsgerichtskandidaten


11. Juni

Bei den letzten Schiedsgerichtswahlen kam die Frage auf, ob durch die vorschlagenden Einfluss auf die Zusammensetzung des Schiedsgericht genommen wird. Nach viel Luft ohne was zu wissen kam man wie immer zum Ergebnis, das Admins daran Schuld sind und die Vorschläge völlig willkürlich gemacht werden. Aber wie sieht es den wirklich aus? Bisher gab es fünf Wahlen in den 30 Kandidaten[1] erfolgreich gewählt wurden.

Unter den erfolgreichen Kandidaten waren 24 Admins (80%)[2] sowie 6 amtierende Schiedsgerichtsmitglieder (SGM) (20%). 1 mal war ein ehemaliges SGM – mindestens ein halbes Jahr ausgesetzt – erfolgreich. Das amtierende Schiedsgericht hat den größten Anteil normaler Benutzer (30%).

Die Vorschläge kamen unterschiedlich zusammen: 5 schlugen sich selbst vor (16%). 7 wurden von amtierenden SGM vorgeschlagen (23%).[3] Den meisten Erfolg mit seinen Vorschlägen hatte Achates (4, die Hälfte seiner Vorschläge waren normale Benutzer) vor Streifengrasmaus (3) gefolgt von Marcus Cyron und Tinz (je 2).


  1. Bei der ersten Wahl gab es 10 Kandidaten, danach je 5.
  2. Mehrfach-Kandidaturen und Mehrfach-Ämter beachten.
  3. Ohne Selbstvorschläge amtierender Schiedsgerichtsmitglieder


etwas statistik – was bringt „Was geschah am …?“ auf der hauptseite einem gelisteten artikel?


29. April

Wie jeden Tag waren auch am 29. April fünf Artikel in der Rubrik gelistet. Zwei Kriege, einmal Technik und zwei Kulturschaffende. Sieger nach Punkten wurde La Jamais Contente mit 30.300 Zugriffen[1] vor Jeanne d’Arc mit 22.900. Die anderen drei kamen unter ferner liefen: Sardinischer Krieg (5900), Duke Ellington (4100) und Joe May (2400). Die Contente hatte den Vorteil das Bild (7300) zu haben und hat selbst mehr Zugriffe als der Artikel über den Tag (23.300).

Im Artikel der Contente tut sich am meisten. Das dürfte mit dem noch geringen Ausbau zu tun haben und der kurzen Existenz – d'Arc ist lesenswert und die anderen auch schon recht umfangreiche, alte Artikel. Auch bei dieser Kategorie zeigt sich, dass Sensationen und Rekorde sowie generell populäre Themen im Vorteil sind. der mit einem bild beworbene artikel ist im Vorteil gegenüber dem Rest.


  1. erhoben mit http://stats.grok.se/


etwas statistik – was bringt „schon gewusst“ auf der hauptseite einem gelisteten artikel?


drei fälle

the egg
zugriffe am ersten tag 9900 (freitag, 12. Februar), am zweiten Tag 3900, nicht vandaliert, einige kleine verbesserungen, sowie massives geschwurbel. lemmafrage wird aufgeworfen und der artikel im anschluss von „the egg (sessel)“ auf „ei (sessel)“ geschoben. zugriffszahlen in der peripherie (vergleich zum vortag):[1] Arne Jacobsen (designer) +1000, The Swan (schwestermodell) +2800, Radisson SAS Royal Hotel (erste verwendung) +529, Kunstindustrimuseet (Kopenhagen) +74; bild des sessel (auch teaser) +1800

lever house
zugriffe am ersten tag 10.700 (donnerstag, 12. März), am zweiten Tag 2400, nicht vandaliert, wenige kleine verbesserungen, nix neues. zugriffszahlen in der peripherie: Gordon Bunshaft (der architekt) +275, Skidmore, Owings and Merrill (arbeitgeber von gordon) +256, Park Avenue (Manhattan) (standort) +388, Internationaler Stil (stil) +2200, Arne Jacobsen (hat ein ähnliches gebäude gebaut) +100, Radisson SAS Royal Hotel (das ähnlich gebäude) +1300, Ei (Sessel) (wird beim ähnlichen gebäude erwähnt) +41; bilder: teaser +1600, artikelbild +2600, bild vom sas royal hotel +244

vw t1
zugriffe am ersten tag 19.000 (sonntag, 26. April), am zweiten Tag 24.800, einmal vandaliert, einige kleine verbesserungen zum großteil aber reguläre artikelarbeit der hauptautoren. in der peripherie tut sich nix. zugriffszahlen dort:[2] Alfred Haesner (entwicklungsleiter) +25 (+13), Ben Pon senior (ideengeber) +294 (+308), VW-Bus +500 (+800), Ivan Hirst +105 (+95), VW Typ 82 +1200 (+1300), Heinrich Nordhoff +57 (+109), VW Käfer +1000 (+1200); bilder: teaser (nicht im artikel) +1900 (-48), bild der infobox +320 (+634), erstes bild im abschnitt geschichte +916 (+2200), skizze des ersten t1 +950 (+2400), hippie-bus am ende +513 (+929)

fazit

die listung bei „schon gewusst“ bringt einem artikel zu allererst mal aufmerksamkeit. auch die umliegenden artikel profitieren davon, wenn auch in unterschiedlichem maß. bei allen drei fällen handelt es sich im weitesten sinne um technische objekte, die zwischen 1949 und 1960 entwickelt wurden, mit unterschiedlicher auswirkung und kultureller bedeutung in deutschland, was sich in den aufrufen auch zeigt (der deutsche t1 führt mit 44.000 Aufrufen vor dem dänischen sessel (14.000) und dem amerikanischen gebäude (13.000)). die entwickler selbst bekommen weniger aufmerksamkeit als vergleichbare objekte. die bilder des artikels und das teaserbild werden recht häufig vergrößert angesehen. inhaltlich bewegt sich nicht sonderlich viel, kleiner tippfehler werden korrigiert (vor allem von IP oder selten aktiven benutzern). die so angesprochenen leser scheinen eher nicht aus dem kreis der regelmäßigen autoren zu kommen.

nachtrag

ein australisches museum bekam 2400 am ersten Tag.


  1. erhoben mit http://stats.grok.se/
  2. Werte in Klammern: zweiter tag im vergleich zu dem tag vor der listung


etwas statistik – was bringt der hinweis zusammenfassung und quellen anzugeben?


tag 2007 2008 2009
1 55 59 38
2 60 70 47
3 47 57 37
4 77 55 27
5 71 34 34
6 50 37 39
7 47 76 34
ø 58,1 55,4 36,6

vm-fälle

die ersten 7 tage des april 2009, 2008, 2007 anhand archivierter meldungen auf VM im vergleich. seiteneffekt beabsichtigt?

update 8. Februar 2010: Seit die Zusammenfassungspflicht abgeschaltet wurde sind die VM-Zahlen wieder auf altem Niveau.