Wikipedia Diskussion:Wikipedistik/Soziologie/Archiv

aus Wikipedia, der freien Enzyklopädie
Letzter Kommentar: vor 15 Jahren von Qwqchris in Abschnitt Seiten zusammenfassen
Zur Navigation springen Zur Suche springen

"kleine Nabelschau"

Auf der Seite "Aktuelles" wird dieses Projekt erwähnt und als "kleine Nabelschau" bezeichnet. Laut Wikipedia-Artikel versteht man heutzutage unter Nabelschau eine "sinnlose Introspektion", und meist "impliziert dies die Aufforderung, der so Bezichtigte möge aufhören, um sich selbst zu kreisen, und sich aktiv seiner Umwelt zuwenden". Was soll ich davon halten? --Mira 15:58, 17. Apr 2004 (CEST)

War nicht als Kritik oder Abqualifizierung gemeint (im Gegenteil), sondern als Hinweis, dass die Seite sich innerhalb der Wikipedia mit der Wikipedia beschäftigt. Wenn Du den Hinweis auf das Projekt gerne ändern möchtest, nur zu: Vorlage:Neuigkeiten. Gruß Sansculotte 16:22, 17. Apr 2004 (CEST)

Na dann ist es ja in Ordnung. Wie man sieht, ist es nicht so einfach mit der Sprache und der Verständigung -). --Mira 17:29, 17. Apr 2004 (CEST)

WikiProjekt Wikipedia-Forschung

So ungefähr zeitgleich mit unserer Idee ist auch WikiProjekt Wikipedia-Forschung (Diskussion) entstanden -- wie verhalten wir uns dazu? Von der Seite des Wikipedia-Forschung-Projekts gibt es die Idee, die Selbstreflexion möglicherweise zu integrieren? -- TillWe 14:13, 18. Apr 2004 (CEST)

Wie ich sehe, sind wir dort schon als Teilprojekt gelistet. Das Fo-Projekt hat sich nach eigenen Angaben zum Ziel gesetzt, verschiedene Forschungsansätze zusammenzuführen. Das scheint mir sinnvoll zu sein. Mir ist nicht klar, ob das mehr werden soll als Verlinkung, also auch inhaltliche Diskussion und Querschnittsthemen oder nur ein gemeinsames Dach? Vielleicht fragen wir die Kollegen mal dazu. Das Projekt Forschung ist bisher anscheinend mehr auf organisatorische und technische Themen ausgerichtet, eine Zusammenführung wäre so problemlos und ergänzend. Im allgemeinen halte ich nicht viel von unnötigen Abgrenzungen. Den explizit soziologischen Zugang zum Thema sollten wir als Rahmen aber unbedingt erhalten, das scheint mir fruchtbar zu sein, um ein paar andere Perspektiven zu in die Argumentation einzubringen, als die in vielen Diskussionen immer schon wiederholten. Was ist deine Meinung? --Mira 17:58, 18. Apr 2004 (CEST)
Siehe Wikipedia Diskussion:WikiProjekt Wikipedia-Forschung für einen kurzen Kommentar. Vielleicht sollten wir irgendwo auch mal aufführen, was eigentlich unsere Erkenntnisinteressen sind. Die Artikelstichproben bei uns sind wohl mehr aus Neugierde und ohne Hypothese entstanden. Presroi interessiert sich, glaube ich, hauptsächlich dafür, wie man die Artikelstreuung beeinflussen und gezielt "anfeuern" kann (siehe Wikipedia:Wikipedistik/Hypothesen#Korallenriffvergleich_(Artikelwachstum)). Ich habe mich mal kurzzeitig mit dem emanzipatorischen Potenzial der Wikipedia beschäftigt (siehe Benutzer:Asb/Drafts/Radiotheorie_reloaded), das aber wieder aufgegeben; momentan interessiert mich mehr das hier: Benutzer:Asb/Drafts/Möglichkeiten enzyklopädischen Wissens. --asb 14:50, 19. Apr 2004 (CEST)

Empowermentprozesse

Was sind Empowermentprozesse und gibt es dafür kein verständliches Wort? Stefanwege 17:16, 1. Jul 2004 (CEST)

Empowerment heißt soviel wie: Leute er-mächtigen, also jemand dazu bringen, selber etwas tun zu können. Soweit ich weiss, gibt es dafür kein gutes deutsches Wort. -- TillWe 00:46, 3. Jul 2004 (CEST)
Soweit es Wikipedia betrifft kann die Ermächtigung ja nur durch Vermittlung von Wissen geschehen. Also wäre "Bildung" ein gutes Wort. Meinst du mit deinen "Empowermentprozessen" sowas wie "Freiheit durch Bildung" bzw. "Freiheit durch Wissen" ? Stefanwege 15:19, 5. Jul 2004 (CEST)
Es meint, die Sache mit der Bildung und der Weitergabe des Wissens selbst in die Hand nehmen und es nicht etablierte Firmen oder Institutionen überlassen. Daher auch selbst auswählen, was geschrieben wird, den ganzen Auswahl- und Erstellungsprozess selbst organisieren und dadurch auch neue oder erweiterte Kompetenzen erwerben und solche Dinge.--Mira 17:03, 5. Jul 2004 (CEST)
Schönen Dank! - Jetzt hab ichs verstanden. Sollte man vielleicht noch in den Artikel schreiben. Stefanwege 22:23, 7. Jul 2004 (CEST)

Empowerment heist Ermächtigung -- da dieses Wort im Deutschen allerdings stark negativ vorbelastet ist (siehe Ermächtigungsgesetz), verwendet man meist den englischen Begriff. Auch klingt Ermächtigung in meinen Ohren nach etwas Bürokratischem (Einzugsermächtigung), und nicht nach dem, was hier eigentlich gemeint ist: Eigenverantwortung und Power to the People. -- D. Düsentrieb (?!) 18:25, 29. Jul 2004 (CEST)

Wikimanie

Da mir als Wikisüchtigem das sozialwissenschaftlich relevante Phänomen der Wikimanie am Herzen liegt, möchte ich nur mal anfragen, ob das hier jemand interessiert, oder ob der Artikel besser gelöscht wird. -- fluss 23:23, 13. Aug 2005 (CEST)

Da der Begriff in der Medizin noch nicht etabliert zu sein scheint, wird der Artikel wohl besser gelöscht. Vielleicht möchtest du den Text ja unter Wikipedia:Bist-du-wikipediasüchtig-Test einbauen? grüße, Hoch auf einem Baum 03:53, 15. Aug 2005 (CEST)
Danke, is gut so -- fluss 17:02, 16. Aug 2005 (CEST)

Archiv von http://de.wikipedia.org/wiki/Wikipedia_Diskussion:Wikipedistik/Soziologie/Erhebungen

Allgemeine Anregung

Zur Anregung siehe Methoden der empirischen Sozialforschung

Vorschläge für neue Erhebungen und Fragestellungen

siehe auch:

Andere wikiinterne Ressourcen zur Selbstreflexion

Der Gesamtprozess der Wikipedia kann soziologisch unter verschiedenen Aspekten betrachtet werden, wobei jeweils eine Ebene oder Gestalt in den Vordergrund tritt: Wissen - System/Institution - Handeln (Interaktion) - Kommunikation - gesellschaftliche Entwicklung.

Auflistung

  • 1.1 Quantitative Methoden: Auswertung von Listen, Statistiken
  • 1.2 Qualitative Methoden: Auswertung von Diskussionen
  • 1.3 Reaktive Verfahren:
    • 1.3.1 Befragung: eher schwierig zu bekommen, wenn dann als Wikipedia:Umfrage
    • 1.3.2 Beobachtung: gibt nur wenig Daten
    • 1.3.3 Experiment: wohl nicht
    • 1.3.4 Inhaltsanalyse: Auswertung von Listen, Benutzerstatistiken, Kommentaren...
  • 1.4 Nichtreaktive Messverfahren: bisher noch nicht

Siehe auch

Allgemeine Statistische/empirische Erhebungen mit bislang wenig soziologischem Schwerpunkt finden sich unter:


1. Erhebung (Falsch)

Wikipedianer pro Bundesland
Wikipedianer pro Bundesland graphisch
  • Grundgesamtheit: Alle (angemeldeten) Wikipedianer: N = ?
  • Stichprobe: Kategorie:Benutzer aus Deutschland
  • Abgeleitete Größe: Absolute Zahlen in Relation zu Bevölkerungszahlen der Bundesländer
  • Datum: 7. Oktober 2005
  • Erläuterung:
dunkelrot: 0,02 / 10.000
rot: 0,04 / 10.000
orange: 0,06 / 10.000
gelb: 0,08 / 10.000
dunkelgrün: 0,12 / 10.000
grün: > 0,14 / 10.000

Kritik

Soweit ich das sehe, wurde nicht berücksichtigt, daß Unterkategorien nicht mitgezählt werden. Daher sind die Ergebnisse wertlos. --qwqch 00:05, 18. Jan 2006 (CET)

Zusammenhang von BIP und Artikelanzahl

Die Grafik enthält einige Ecken:

  • Bei w:en muß mit BIP USA+GB gearbeitet werden (GB alleine sicher nicht repräsentativ)
  • Die logaritnmische Darstellung verfälscht gerade im unteren Bereich (dort besonders große Streuung). Der Ansatz mit georaphisch-volkswirtschaftlichen Kennziffern zu arbeiten verdient jedoch einer Verfolgung (z.B. Telefone o. Internetanschlüsse/Bev).--Hegen 14:28, 22. Mär 2006 (CET)

außerdem sollte man das ganze schon pro einwohner umrechnen, die der jeweiligen sprache angehören 9millionen schweden schreiben absolut gesehen weniger als ca100millionen deutsche,österreicher und schweizer 27.10.06

Bekanntheit bei und Nutzung der WP durch Forscher

(von Artikelseite hierher verschoben)
Ich hab an dieser Stelle mal die "nur", und "jedoch" weggelassen. Ich denke etwa 10% Beteiligung bei Wissenschaftlern ist sehr viel! --qwqch 10:50, 15. Dez 2005 (CET) quelle? --Woody 04:46, 17. Apr. 2008 (CEST)

das hier war meine eigene Meinung. Die Quelle für die 10 % habe ich im Artikel hinzugefügt. --source 09:16, 17. Apr. 2008 (CEST)

Meinungen der Benutzer

Das soziologische Interesse über die Benutzer und ihre Einteilung in Kategorien interessiert die Benutzer wenig. Interessanter Weise gibts viele über aber nicht viele Untersuchungen für die, die es was angeht. Entscheidend für den Nutzen einer Untersuchung ist die Beantwortung der Frage, was findet die Mehrheit der Benutzer in Wikipedia für bleibenswert, und was ist in ihren Augen Wert verändert zu werden. Was läuft generell gut, was läuft generell schlecht und wo muss nachgehakt werden. "Versuch eines Schemas einer Meinungsumfrage zur Zufriedenheit der Benutzer" soll ein erster Ansatz sein. Wichtig ist, auf möglichst einfache Art schnell und effektiv möglichst viele Benutzer zu erreichen. Wenige Fragen und schnelle übersichtliche Handhabung beim Ausfüllen, sowie klare Unterscheidung zwischen positivem und negativem Votum sind der gangbare Weg festzustellen, wo Wikipedia steht.

Sind wir diskussionswütig?

Richtig neugierig wäre ich auf das verhältnis aller artikel zu allen diskussionen und das im internationalen vergleich. Sind wir diskussionswütig? Wie ist das anderswo? Schon klar, daß quantität nicht zwangsläufig was mit qualität zu tun haben muß, aber neugierig bin ich doch... ;-) Gruß

Auf jeden Fall Rechtschreibreform-wütig ;-)
Interessante Idee. --source 19:20, 12. Mai 2008 (CEST)

Seiten zusammenfassen

Hier scheint ja nur noch was auf Wikipedia:Wikipedistik/Soziologie/Erhebungen los zu sein. Daher bin ich dafür den Inhalt in die Hauptseite Wikipedia:Wikipedistik/Soziologie einzufügen. Statt dessen sollten besser die "Speziellen Themen", bei denen seit 2004-2005 im Grunde nichts mehr los ist, ausgelagert werden. --source 20:08, 12. Mai 2008 (CEST)

  • Falls Diskussion bitte hier
dann mach ich das mal --source 20:11, 10. Jun. 2008 (CEST)

Archiv von http://de.wikipedia.org/wiki/Wikipedia_Diskussion:Wikipedistik/Soziologie/Erhebungen/Archiv

"Methoden und Techniken der empirischen Wikipediaforschung"

Welche Methoden stehen uns formal zur Verfügung? Niemand wird wohl eine kostenbringende Studie privat machen wollen. Ist es möglich repräsentativ Fragebogen zu verschicken? Welche soziologischen Erkenntnisse lassen sich über die statistischen öffentlichen Nutzerdaten gewinnen? usw... Mir geht es darum an der Stelle wo ich das geschrieben hatte trotz aller selbstverständlichkeit die möglichen Intrumente zu sammeln. An einer Interpretation bin vorerst nicht interessiert. Wer macht mit? --qwqch 00:09, 22. Aug 2005 (CEST)


Interessant finde ich weniger die selbstverstaendlichen als die aussergewoehnlichen Instrumente -- beispielweise muesste es theoretisch moeglich sein, saemtlichen nicht-anonymen Wikipedia-NutzerInnen einen Fragebogen per eMail zu schicken, was sonst nicht so einfach geht. Die interessanten Kosten sind dann eher die auf der Auswertungsseite. -- TillWe 16:33, 25. Aug 2005 (CEST)
Ich meine, dass man viele Auswertungskosten minimieren kann, in dem man die Erhebung entsprechend modifiziert, z.B. durch Onlinefragebögen, die automatisch eingelesen werden können, oder eben wie bisher durch Sekundäranalysen.
Die Seite Wikipedia:Die Wikipedianer bietet eine Vielzahl an Statistischen Daten --qwqch 15:05, 3. Okt 2005 (CEST)

Vor der Frage nach den Methoden sollte zunächst der inhaltliche Aspekt der Forschungsfrage geklärt werden, da dies die Voraussetzung für eine Entscheidung hinsichtlich der Methodik ist. Allerdings ist eine "repräsentative" Umfrage so gut wie unmöglich, da hierzu eine Grundgesamtheit für eine Stichprobenziehung notwendig ist. Die Grundgesamtheit der aktiven und passiven Wikipedianer ist nicht eingrenzbar.

siehe auch:

Regionale Herkunft...

Flächenkarte mit Farben, Zahlen eingetragen. Aber die Farben repräsentieren doch Wertebereiche? Die Erläuterungen wurden aber nicht gegeben.
Wenn sie nichts repräsentieren würden, dann hätte man benachbarte Länder doch nicht mit gleichen Farben ausgestattet oder ? --Wikipit 18:50, 7. Mär 2006 (CET)

Warum wird die Gesamtzahl der Wikipedianer nicht angegeben? Und wie ist der Unterschied zwischen Wikipedianern und angemeldeten Benutzern definiert? Von letzteren gibt es lt. Wikipedia:Statistik ca. 250.000. Jjkorff 18:49, 11. Dez. 2006 (CET)

Lieber Jjkorff, lies Dir die Diskussion weiter unten auf dieser Seite "Benutzer nach Bundesländern " durch, dann wirst Du verstehen, wie schwer das Problem anzugehen ist. --Wikipit 21:18, 11. Dez. 2006 (CET)

Neue Vorschläge

Wohin sollen die denn? Aus dem Text nach der Überschrift kann ich kein Ziel für neue Vorschläge erkennen!--Wikipit 20:24, 16. Mär 2006 (CET)

Mein Vorschlag: Analyse der Vandalen, Anzahl in den Jahren - Tendenz, registrierte oder Dümmlinge oder echt Bösewichter mit Wiederholung? Wwieviele Ressourcen werden hierdurch eigentlich verschlungen oder korrigiert dies ein, wie heisst das, (ro)Bot(er)? --Wikipit 20:24, 16. Mär 2006 (CET)

  • Die Fragetellung klingt für mich nicht so gesellschaftswissenschaftlich (etwas schon). --Chrisqwq 14:42, 17. Apr 2006 (CEST)

Benutzer nach Bundesländern

Hallo, da ich die Grafiken äußerst interessant fand, habe ich mal ermittelt wieviele Benutzer aus Ilmenau kommen (alle Benutzerseiten geprüft, die auf Ilmenau, Kategorie:Benutzer aus Ilmenau oder die Technische Universität Ilmenau linken, gezählt habe ich alle, die hier momentan wohnen, also auch die Studenten) Ergebnis: 20. Auf 32.478 Einwohner (mit Nebenwohnsitzen (=Studenten)). Damit dürfte die Quote unserer Stadt 10-mal so hoch sein, wie die von Berlin. Grüße --Michael Sander 12:49, 17. Apr 2006 (CEST)

Das klingt interessant. Es könnte in der Tat so sein. Deine Zählung basiert auf einem anderen Erhebungsinstrument glaube ich. Denn wer solch eine User-Box hat, wird glaube ich nicht automatisch in die KAtegorie: User aus ... aufgenommen, oder? Weiß ich aber nicht. Wenn das so ist, dann basieren ie Untersuchungen auf anderen erhebungsinstrumenten. Abereine Gute Kritik. Vieleicht können wir die Zählung ja so noch verfeinern. Hast du dran gedacht, die die in beiden Gruppen sind nur einmal zu rechnen (also "User aus I." und "User der Universität I."? Gruß --Chrisqwq 14:40, 17. Apr 2006 (CEST)
Jap, ich kenne ja nun alle schon so halbwegs und habe die Benutzerseiten rausgesucht die entweder die Kat:B aus IL haben oder auf die Artikel Ilmenau oder Uni verlinken. Bei 20 Leuten geht das ja noch... --Michael S. zufrieden? unzufrieden? 23:49, 5. Mai 2006 (CEST)
@wikipit (siehe meine Diskussion): Denke so wie es jetzt ist meinten wir es beide. Anderes Thema: Man könnte jetzt ja noch etwa schauen wieviel Wikipedianer es in Deutschland wohl ungefähr gibt, und dann hochrechnen, für die einzelnen Bundesländer. --Chrisqwq 19:15, 9. Mai 2006 (CEST)
Das tool liefert mehr als 1000 für D und bricht ab. Hochrechnen geht so auch nicht korrekt. Wer will außderdem bescheinigen, daß die Proportionen der mit dem tool ausgewiesenen eines BL zu allen Usern im jeweiligen Bundesland für alle Bundesländer gleich sei? Die Eitelkeit oder was auch immer kann doch geografisch unterschiedlich ausgeprägt sein. Ist also weit entfernt von exakt.
Meine Frage bleibt: Was liefert denn nun das tool bei der Musterfrage "Benutzer_aus_Mecklenburg-Vorpommern" wirklich? Jeden der seiner Userseite diese Kategorie zugeteilt hat? Oder? Was sollen hierbei noch Unterebenen? --Wikipit 11:16, 10. Mai 2006 (CEST)
Nachtrag zum Nachdenken: "Benutzer_aus_Deutschland" wird nicht konsequent hierarchisch verwendet. So kommt Dr.Morgenes sowohl aus Deutschland als auch Österreich (zumindest im Babel). Genauso verhält es sich mit Städten in Bundesländern. Wo steckt Heidelberg? Aha. Bevor keine hierarchische sich gegenseitig ausschließende (bzw. einschließende) Struktur vergeben und angewendet wird, ist mit dem catscan keine saubere Aussage zu machen.--Wikipit 15:21, 10. Mai 2006 (CEST)

Jan. 2007 : Ich habe zunächst die neuen Zahlen reingestellt, die aber mit dem anderen Tool CoCat erbracht wurden.
Dann habe ich mit CatScan die Doppeleinträge ausgezählt.
Aber als ich das Tool CatScan (im Nicht-CSV-Format) zur Bestimmung der Gesamtzahl/BL heranzog, fiel mir auf, daß "categories", die User-Sammlungen (also Orte eines Bundeslandes) enthalten, also zusätzlich aufgelistet werden, obwohl dieselben User in der Liste bereits genannt werden (in Stichproben überprüft). Diese "Kategorien" störten ebenso wie die Begrenzung auf 1000 Resultate. Deshalb habe ich für das Auszählen aller WPner/BL schließlich CatScan mit CSV-Format genutzt und die Liste in einen zeilenzählender Editor übertrage. Dies liefert die besten Resultate.--Wikipit 19:36, 5. Jan. 2007 (CET)

Registrierte Wikipedianer mit Bundeslandhinweis (auch Subkategorie) auf Nutzerseiten Jan 2007
Die Spalten listen Doppeleintragungen auf
Bundesland alle Ba.W Bay Ber Bra Bre Ham Hes MV NS NRW RP Saar Sach SAn SHo Thü Summe
Baden-W. 1126 X 252 12 2 4 5 17 1 5 18 12 4 3 1 2 236 839
Bayern 1261 252 X 15 0 1 6 307 0 3 16 305 0 2 0 5 236 667
Berlin 507 12 15 X 4 2 1 8 4 7 10 5 2 6 0 5 6 467
Brandenburg 74 2 0 4 X 0 0 0 0 1 2 0 0 5 1 0 0 58
Bremen 77 4 1 2 0 X 0 0 0 7 0 1 0 0 0 0 1 69
Hamburg 214 5 6 1 0 0 X 5 0 2 4 3 2 0 0 6 1 197
Hessen 599 17 305 8 0 0 5 X 0 2 10 307 1 1 0 4 9 265
M.-Vorp. 64 1 0 4 0 0 0 0 X 0 1 0 0 2 1 0 0 60
Nieders. 343 5 2 7 1 7 2 1 0 X 4 1 0 2 1 2 1 325
NRW 1214 18 16 10 2 0 4 10 1 4 X 26 0 4 0 1 5 1164
Rheinl.-Pf. 463 12 301 5 0 1 3 305 0 1 26 X 0 1 0 2 8 131
Saarland 89 4 0 2 0 0 2 1 0 0 3 0 X 0 0 0 0 83
Sachsen 318 3 2 6 5 0 0 1 2 2 3 1 0 X 1 0 3 304
Sachs.-Anh. 60 1 0 0 1 0 0 0 1 1 0 0 0 1 X 1 2 56
Schlesw.-Hol. 171 2 4 5 0 0 6 3 0 2 1 2 0 0 1 X 2 157
Thüringen 375 236 236 6 0 1 1 9 0 1 5 8 0 3 2 2 X 120

Erläuterung: 0 = real 0 | X = Wert identisch "alle" | CatScan : Die erste Kategoriesuche wurde in 7 Ebenen vorgenommen, die zweite Kategoriesuche in 3 Ebenen. Dies ist nach Ansicht des Verf. Ursache der Diskrepanz der kursiv geschriebenen Werte; denn eigentlich müßten sich alle Werte um die X-X-Diagonale spiegeln. | Für die Summenbildung (letzte Spalte) wurden die Mehrfacheintragungen schließlich hälftig abgezogen, eine symmetrische Verteilung voraussetzend. --Wikipit 22:44, 4. Jan. 2007 (CET),--Wikipit 13:59, 5. Jan. 2007 (CET) --Wikipit 19:36, 5. Jan. 2007 (CET)

Benutzer nach Städten

Ich habe gerade aus Eigeninteresse eine Liste nach der Anzahl der Benutzer der 50 größten Städte Deutschlands angefertigt. Besteht Interesse daran? (----Tabelle jetzt auf Artikelseite--- --Wikipit 17:34, 13. Feb. 2007 (CET)) --Toffel 19:01, 10. Feb. 2007 (CET)

Sehr fleißige Arbeit und auch raffinierte interaktive Darstellung! Womit aber ausgezählt? Hast Du Mehrfacheintragungen rausgerechnet?--Wikipit 19:14, 10. Feb. 2007 (CET)

Die Städte und deren Einwohnerzahlen habe ich aus der Liste der Großstädte in Deutschland übernommen. Über die Städte habe ich dann die Kategorien gesucht (z. B. Kategorie:Benutzer aus Berlin). Die Anzahl der Wikipedianer habe ich aus den Angaben am Anfang übernommen. An Mehrfacheintragungen habe ich zunächst zwar gedacht, dann aber vergessen. Wie kann man das denn rausrechnen? --Toffel 21:51, 10. Feb. 2007 (CET)

Wird aber eine Schweinearbeit, denn Du mußt eigentlich alle Kombinationen durchrechnen. Siehe Dir mal oben meine Tabelle WPner nach Bundesländern und die Artikelseite mit den Quellen an. Als Tool nimm Catscan mit der Ausgabe vom Typ CSV (nicht die normale, weil die Dir alle user-Kategorien auch noch reinrechnet). Nachdem Dir die Summenzahlen für jede Stadt (2.Tabellenspalte meiner Tabellenstruktur, 3.Spalte Deiner obigen) schon vorliegen, müßtest Du noch nacheinander in zweiter Ebene von Catscan jede Kombinationsstadt eintragen und das Ergebnis in einen zeilenzählenden Editor kopieren. Die Zeilengesamtzahl (eventuell Fehlzeilen am Anfang und Ende angucken und rausrechnen) ist das Einzelergebnis. So gehst Du Schritt für Schritt vor und füllst die Spalten. Ist die Tabelle fertig ausgefüllt, ziehst Du die jeweiligen Summen der Doppeleintragungen für jede einzelnen Stadt zusammen und ziehst dieses Resultat dann zur Hälfte von der ursprünglichen Summe wieder ab, in der Annahme, daß nur Doppeleinträge kompensiert werden müssen und man jeder Stadt nur die halbe Doppelnennung zusteht. Es ist eine symmetrische Kompensation, da man ja nie weiß, was der User mit solcher doppelter Nennung bezweckte. Da Dreifachnennungen m.E. eine noch geringere Bedeutung haben wird, habe ich sie ganz vernachlässigt. Theorie bis hierher ist einfach, aber die Ausführung bei so vielen Kombinationen ist manuell sehr ermüdend. Vielleicht solltest Du Dich nur auf die 10 Städte mit den meisten WPnern konzentrieren und abarbeiten, das reicht Dir ganz sicher ;-)--Wikipit 00:25, 11. Feb. 2007 (CET)

Also ab der Stelle mit der weiten Ebene von Catscan verstehe ich nichts mehr. Aber mir ist gerade eine andere Methode eingefallen: Einfach alle Einträge kopieren, in Tabellenform bringen, alphabetisch sortieren und doppelte aussortieren. Die ganze Prozedur hat für die ersten Zehn wikipedianerreichsten Städte (im Verhältnis gesehen; vierte Spalte) etwa eine Stunde gedauert. Alle Benutzer mit zwei Einträgen sind Benutzer:$array, Benutzer:Baudolinos, Benutzer:Bdrain, Benutzer:Buncic, Benutzer:Das .:X, Benutzer:Degreen, Benutzer:FredS, Benutzer:HackJack, Benutzer:Hans-Peter Scholz, Benutzer:Horge, Benutzer:KayH, Benutzer:Luidger, Benutzer:Markus Prokott, Benutzer:Martin.Bemmann, Benutzer:Michaelt1964, Benutzer:Purodha, Benutzer:Querica, Benutzer:Rheum Rhabarbarum, Benutzer:RolandHagemann, Benutzer:Sabichão, Benutzer:Stefan Selbach. In welche Stadt soll ich die jetzt einsortieren? Oder sollte man sie für zwei Städte führen, weil sie ja auch für zwei Städte "arbeiten"? --Toffel 13:03, 11. Feb. 2007 (CET)

Zur ersten Frage: Zunächst muß ich nachvollziehen können, was Du genau tatest: Catscan im Normalformat, alle Seiten: "Benutzer aus Mainz" nur 54. Catscan im CSV ist bis jetzt nicht vonnöten! Nichts verfälschendes gefunden, Du Glücklicher. CSV angekreuzt ermöglicht nämlich nicht nur eine Bereinigung von störenden Kategorien sondern auch zusätzlich die Überwindung der Grenze von 1000, die Dich ja nie zu treffen scheint. - Beispiel für Dich: Erste Zeile "Finde in Kategorie" "Benutzer aus Berlin" und zweite Zeile "Seiten nach Kategorie" "Benutzer aus München" finde ich gleich drei Benutzer mit Doppeleintrag, aber stimmt, Berlin nanntest Du gar nicht?! Berlin ist leider nicht nur Stadt, sondern auch BL. Auch Hamburg oder Bremen. Die hast Du fortgelassen. Berlin heute 521, Berlin komb. mit Köln 5, mit Stuttgart 3, ... Alles keine sehr großen Zahlen. Man darf in einer Erläuterung nicht vergessen, dass keineswegs alle User Stadteinträge an sich und schon gar nicht als Kategorien vornehmen, denn Babel tuts ohnehin bei Catscan ohne besondere Aufmerksamkeit nicht.--Wikipit 15:35, 11. Feb. 2007 (CET)
Antwort auf zweite Frage: Ich schrieb, dass ich die Doppeleinträge nicht einem, sondern jedem zur Hälfte zugeordnet habe. Das bdeutete, Doppeleinträge halbieren (=zur Hälfte), danach von der unbereinigten Summe abziehen. Wenn Du andersherum rechnest, mußt du die Hälfte zur bereinigten Summe zuzählen, klar?--Wikipit 15:35, 11. Feb. 2007 (CET)

Die Städte mit den prozentual wenigeren Wikipedianern habe ich vorhin rausgenommen, sodass nur noch die "Top Zehn" übrig blieben. Dabei fielen auch die Stadtstaaten weg. Das mit dem Catscan habe ich jetzt verstanden, ist mir aber zu mühselig. Die doppelten Einträge habe ich mit meiner Variante ja jetzt auch. Ich muss sie nur noch abziehen. Aber zu meiner letzten Frage (dritte Frage): Wenn auf der Benutzerseite steht: "Dieser Benutzer kommt aus Berlin" und "Dieser Benutzer kommt aus München", kann man den Benutzer doch auch bei beiden Städten aufführen. --Toffel 16:20, 11. Feb. 2007 (CET)

Niemand kann aus zwei Städten zugleich kommen. Eigentlich kann man ohnehin nicht zwei Städten zugleich angehören, weil eine Person nicht teilbar ist. Da man aus der zweifachen Nennung heraus nicht erkennen kann, welcher Stadt er zugeordnet werden soll, kann man ihn hälftig zuordnen. Erst ganz zuletzt, nach der Summenbildung, aber dann auf ganze Personen aufrunden, damit kein Protest ertönt.--Wikipit 17:56, 11. Feb. 2007 (CET)

Ich hab' die Zahlen geändert. Schau dir mal die Benutzerseite von Benutzer:$array und die von Benutzer:HackJack an. Entweder hat dieser Benutzer gleich eine Sockenpuppe mitangelegt oder beides sind Zwillingsbrüder, die immer alles zur selben Zeit machen :-) Auch die Benutzerseite von Benutzer:Markus Prokott ist sehr interessant. Er kommt aus drei Staaten und vier Städten, wobei das nur die von Deutschland sind. Außerdem gehört er drei unterschiedlichen Religionen an. --Toffel 18:45, 11. Feb. 2007 (CET)

Hab den beiden auf deren Diskussions-Seite etwas Kritik geschrieben.--Wikipit 11:22, 12. Feb. 2007 (CET)

Nachtrag: Kein Wunder dass die Benutzer mehrere Staaten und mehrere Städte einfach so auflisten, wenn es hier unter Beispiel 4 schon so vorgegeben wird. --Toffel 07:48, 12. Feb. 2007 (CET)

Nein! Dein Beispiel zeigt nur, daß man unter Babel mehrere Sprachen nennen darf, was ja logisch ist. Mehrere Städte auf einmal finde ich dort nicht. Außerdem listet Catscan überhaupt keine Babels (vielleicht unter Vorlagen, was ich nicht prüfte), sondern Kategorien! Die Städte müßten also bei den Usern als Kategorie eingetragen sein, wenn Catscan zuschlagen soll, was auch die große Dunkelziffer erklärt zwischen "Usern an sich" und "Usern mit Städten". Auch ich habe keine Stadtkategorie, weil ich relativ anonym bleiben wollte. Das Gleich gilt mit den Landeskategorien. So mußt Du auch bei meinen Tabellen die Fußnoten/Anmerkungen verstehen.--Wikipit 11:22, 12. Feb. 2007 (CET)

Richtig, mehrere Städte sind dort nicht aber mehrere Staaten: "Viertes Beispiel: dreisprachiger türkischstämmiger Stuttgarter" Im Babel dann: "Dieser Benutzer kommt aus der Türkei" und "Dieser Benutzer kommt aus Deutschland".
Bei meinem Stadt-Babel ist es so, dass die Kategorie gleich mit dranhängt. Ist das nicht bei allen so? --Toffel 14:52, 12. Feb. 2007 (CET)

Ja, Du hast Recht. Ich habs vergessen oder es wurde mal geändert, daß der Babel-Vorlagebaustein heute die Kategorie automatisch einfügt. Das Problem der Doppel- (und Dreifacheinträge) bleibt. Bei meinem Problem, der BL-Auflistung kannst Du oben schon sehen, welch absurdes Ausmaß die Sache angenommen hat: Bayern hat 1261 als unbereinigte Summe, - 262 BadenW., - 307 Hessen, - 305 RP, - 236 Thür.. Hätte ich da nicht halbiert, sondern voll abgezogen, haha, dann gäbs fast gar keine Bayern mehr!--Wikipit 15:42, 12. Feb. 2007 (CET)

...und erst bei Hessen, Rheinland-Pfalz und Thüringen. Aber was machen wir mit der Liste oben? Einstellen? --Toffel 17:34, 12. Feb. 2007 (CET)

Ja, natürlich. Aber bitte mit kurzer Erläuterung, auch mit Fehl-Hinweis, die "Stadtstaaten" unter BL zu suchen, oder nimm die drei doch mit auf, weil man sie dann so schön sortieren kann. Meine Tabelle hat zwei Header- und eine Summenzeile, weswegen class="sortable" nicht gut klappt, leider. Aber vielleicht ändere ich irgendwann die Struktur. --Wikipit 00:11, 13. Feb. 2007 (CET)

Ich habe die Stadtstaaten mit reingenommen. Doppeleintragungen untereinander und mit den anderen Städten habe ich entfernt. Was noch nicht in der Tabelle war, sind Eintragungen von Unterkategorien der Städte, die aber nich bei den dazugehörigen Städten zu finden sind. Die habe ich jetzt ergänzt. --Toffel 17:19, 13. Feb. 2007 (CET)

Schöne Übersicht und ein Schreck für die Stadtstaaten.--Wikipit 17:34, 13. Feb. 2007 (CET)

Was habt ihr eigentlich für Probleme? Ich kenne sehr viele, die in einer Stadt leben, aber von Montag bis Donnerstag oder Freitag an einer Uni in einer anderen Stadt arbeiten und dort natürlich auch ein Zimmer haben. Ich kenne sogar jemanden, der in einer deutschen Stadt seine Familie hat und mehrere Monate im Jahr dort lebt, den Rest aber an einer Universität in China doziert. Und solchen Leuten sagt ihr, dass sie sich nicht zwei verschiedenen Städten zuordnen dürfen? Gruß, --Nikita 15:53, 23. Mär. 2007 (CET)

Es ging bei der Diskussion um das Erstellen einer Statistik. Ich habe ja auch nichts dagegen, wenn ein Benutzer aus "mehreren Städten kommt". Das ist aber bei der Anfertigung einer Benutzerstatistik extrem hinderlich, denn man kann nicht einfach alle zusammenrechnen, die auf ihrer Benutzerseite einen entsprechenden Babel-Baustein haben. Sonst könnten wir theoretisch mehr Benutzer als Einwohner einer Stadt haben. --Toffel 16:54, 23. Mär. 2007 (CET)

Zusammenhang von Sprechern einer Sprache und Wikipediaartikeln in der Sprache

Was ist das denn für ein merkwürdiges Ergebnis. Dem scheint nicht die Anzahl etwa der Französischsprachigen zugrunde zu liegen, sondern die Einwohnerzahl Frankreichs, denen sämtliche französischsprachigen Artikel zugeschrieben werden. Kein Wunder, dass Frankreich dabei gut abschneidet. --Nikita 15:47, 23. Mär. 2007 (CET)

Also wenn ich mit der Einwohnerzahl Frankreichs (60.656.178) rechne komme ich auf 7.287 Artikel pro 1 Mio. Einwohner. Rechne ich die Werte aus der Grafik um, komme ich auf 72.046.000 Französischsprachige. Das sind trotzdem zu wenig. --Toffel 17:14, 23. Mär. 2007 (CET)
Jedenfalls gibt es deutlich mehr französisch- als deutschsprachige Menschen und deutlich weniger frz. als dt. Artikel. Dass die pro-Kopf-Artikel-Zahl zugunsten der fr-wikipedia ausfällt und dies auch noch als auffällig kommentiert wird, kann ja nicht stimmen. --Nikita 17:43, 23. Mär. 2007 (CET)


Denke bei der englischen Wikipedia ist so langsam die Sättigung erreicht und somit schneidet sie nicht so gut ab. Schaecsn 07:09, 8. Apr. 2007 (CEST)

Erhebung

Ich will noch anfügen, dass man bei der Erhebung unbedingt alle deutschsprachigen Länder (Deutschland, Schweiz, Österreich usw.) berücksichtigen sollte. Ist höchstwahrscheinlich schon so geplant, war nur verwirrt wegen: "Regionale Herkunft (Listenauswertung: Wikipedianer nach Bundesländern)" --Bachauf 22:59, 1. Mär 2006 (CET)

    • ich habs nicht geplant... nur zu.. --Chrisqwq 00:32, 5. Mär 2006 (CET)

Weiteres Archiv