Wikipedia Diskussion:Wartungsbausteinwettbewerb/Archiv/2012

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Nächster Termin

Ich denke, dass es für einen Winter-2012-Wettbewerb mittlerweile etwas zu spät ist, weil er ja traditionell im Februar stattfinden müsste. Ich würde deshalb vorschlagen, als nächstes einen Frühjahrswettbewerb im Mai 2012 ins Auge zu fassen. Meinnungen dazu? -- Gruß  Sir Gawain Disk. 20:17, 29. Jan. 2012 (CET)

Bin im WikiCup engagiert. Frag' mich mal, falls ich die erste Runde überstanden habe ;-) --Laibwächter 22:06, 29. Jan. 2012 (CET)
Nachsatz: bei mir gehen die ersten beiden Maiwochen nicht. --Laibwächter 14:40, 30. Jan. 2012 (CET)
Also ich sehe keinen Grund, weshalb wir auf den Winterwettbewerb verzichten sollten. Bisher hat er ja immer einmal im Quartal stattgefunden. Ich selbst stehe aufgrund begrenzter Zeitkapazitäten zwar nur für die Organisation zur Verfügung, aber bestimmt finden sich wie gewohnt Teilnehmer, hoffentlich auch ausreichend Schiedsrichter. Folgende Termine kommen meines Erachtens in Frage:
  • 10. Februar bis 24. Februar
  • 17. Februar bis 2. März
  • 24. Februar bis 9. März
--Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 15:33, 30. Jan. 2012 (CET)
Ich dachte, dass ein Wettbewerb im Februar vielleicht zu kurzfristig wäre, wenn's trotzdem klappt, umso besser :) -- Gruß  Sir Gawain Disk. 08:03, 31. Jan. 2012 (CET)
P.S.: Mein Terminfavorit wäre der 17.2.-2.3.
Ich werde bisweilen mit den Einladungen beginnen. Dann kommen sicherlich noch mehrere Terminwünsche rein. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 18:19, 8. Feb. 2012 (CET)
Alles klar! Wenn du Hilfe gebrauchen kannst, sag' Bescheid. -- Gruß  Sir Gawain Disk. 18:52, 8. Feb. 2012 (CET)
24. Februar bis 9. März wäre mir am liebsten. Eigentlich ist's mir aber egal, da ich Ferien hab. :) -- Zacke Neu hier? 19:46, 8. Feb. 2012 (CET)
20. Februar bis 14. März würde Zacke's Zeitraum als Teilmenge einschließen; da hätte ich auch "Ferien"; ein guter Trumpf um mal richtig Bausteine zu zerkauen. --WissensDürster 19:54, 8. Feb. 2012 (CET)
Mir ist das eigentlich egal, weil meine Ferien erst Ende März beginnen. Aber ich würde auch eher die letzten beiden Termine bevorzugen, die in den März reingehen. Alles andere wäre zu knapp. --Elsensee 20:07, 8. Feb. 2012 (CET)
Ich kann diesmal leider weder als "Mitspieler" noch als "Organisator" mitwirken :( sorry :/ --Trollhead 20:14, 8. Feb. 2012 (CET)
Ich wäre für die beiden letzten Termine zu haben, der erste wäre aber auch möglich. Darf ich mir auch gleich das Schiri-I reservieren? --Inkowik 20:16, 8. Feb. 2012 (CET)
Von den vorgegebenen Zeiträumen passt für mich nur der letzte vom 24. Februar bis zum 9. März, aber auch da kann ich erst ab Woche zwei mitmachen. Alles andere wird schwierig... -- Memorino (D) Mentorenprogramm? 20:22, 8. Feb. 2012 (CET)

Die beiden letzten klingen beide gut. --Polarlys 20:48, 8. Feb. 2012 (CET)

Mir wäre der letzte Termin am liebsten. --Toffel 21:03, 8. Feb. 2012 (CET)

Überschneidung mit dem WP:SW finde ich nicht so gut. Aber ich kann auch erst ab dem 24. Februar wirklich mitmachen... --Gripweed 00:35, 9. Feb. 2012 (CET)

Für mich wird es wie oben angedeutet zeitlich im Rahmen der WP recht eng. Als neue Herausforderung hatte ich mir den WikiCup (die Überschneidung schlechthin) ausgesucht, bei dem mir einmal etwas andere Fähigkeiten abverlangt werden und mir die Punkte des hiesigen Bausteinwettbewerbs im ersten Quartal aufgrund der zum Teil langen Auswertungszeit nicht zugute kommen werden. Von daher wäre mir ein Termin für den Bausteinwettbewerb Ende Februar am liebsten – schaffe ich beim Cup den Cut der besten 32 Teilnehmer nicht, kann ich mich dann ganz auf den WBW werfen, was dann auch den Schiri beinhalten könnte. (nicht signierter Beitrag von Laibwächter (Diskussion | Beiträge) 09:41, 9. Feb. 2012 (CET))
Da ich ebenfalls am WikiCup teilnehme, würde ich vorschlagen, den Bausteine-Wettbewerb auf Ende Februar zu verlegen. Mein Vorschlag wäre daher: 27. Febr. bis 9. März. Gruß -- Ra'ike Disk. LKU WPMin 10:49, 9. Feb. 2012 (CET)

Mir scheint, die Tendenz zum spätesten Termin ist sehr eindeutig. Wollen wir den 24.2.-9.3. festzurren? -- Gruß  Sir Gawain Disk. 11:40, 9. Feb. 2012 (CET)

Vom 17.2 bis 2.3. wäre ideal bei mir. ----Fussballmann schwätz mit m'r 17:33, 9. Feb. 2012 (CET)
Bei allem, was in den März geht, wäre ich als Schiedsrichter draußen. Doppelbelastung Schreibwettbewerb und Wartungsbausteinwettbewerb ist mir zu viel, vorher ist leider das Real Life am beuteln, wäre aber dann noch möglich. Sollte Bunnyfroschs Termin gewählt werden, wäre ich vermutlich als Teilnehmer auch so gut wie draußen. --Gripweed 23:18, 10. Feb. 2012 (CET)
an mir solls nicht scheitern ... mir gehts auch nicht um den sieg :-) Bunnyfrosch 01:10, 12. Feb. 2012 (CET)
24. Februar bis 9. März sollte passen. Gruß --Mailtosap 00:09, 12. Feb. 2012 (CET)
+1 zu Mailtosap und Sir Gawain. Dieser Termin scheint wohl bei vielen näher zu liegen. Aber wir sollten langsam mal in die Puschen kommen, sonst rennen uns die Tage immer mehr weg. --Funkruf WP:CVU 09:31, 14. Feb. 2012 (CET)
ja --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 16:10, 14. Feb. 2012 (CET)

Teams ab vier Personen (verschoben)

Was war denn nochmal gleich die Begründung für Benachteiligung von Teams mit >3 Mitgliedern? Ich hab das letzte Mal aus diesem Grund als Einzelkämpfer teilgenommen; beim vorletzten Mal wurde ein Teilnehmer von einem anderen höflich gebeten, ein eigentlich für alle offenes Team wieder zu verlassen, weil er den Schnitt runterzöge (obwohl er mitgearbeitet hat). Kann man die Endpunktzahl nicht einfach durch die Zahl der Teilnehmer teilen und fertig?--Toter Alter Mann 18:04, 13. Feb. 2012 (CET)

Hallo TAM,

der Grund ist der, dass durch die erhöhte Mitgliedszahl ein Vorteil bei der Artikelverbesserung besteht, weil ja mehrere Leute Leistungen bringen als zum Beispiel einer. Normalerweise ist es ja so, dass bei Teams ab 4 Personen die Punkte mal 3 genommen werden und dann durch die Anzahl der Teams geteilt wird. Einfach, damit auch Teams oder Einzelpersonen auch eine Chance haben, "an der Spitze zu sein". Sonst kann es zudem passieren, dass die Sache langweilig wird, weil eben schon im Vornhinein der Sieger feststehen würde. --Funkruf WP:CVU 09:22, 14. Feb. 2012 (CET)

Funkruf so ist es aber so dass ein Team sagen wir aus 6 Leuten keine Chance hat weil ja alle Punkte nur halb gezählt werden. Dabei sollten doch gerade große Teams gefördert werden. Ich finde die Regeln so auf jeden Fall falsch. --Ixitixel 12:18, 14. Feb. 2012 (CET)
Mit der Regel sollte verhindert werden, dass es wie z. B. im Herbst 2009 nur Riesenteams und Einzelkämpfer gibt, stattdessen sollte die Teilnahme in 3er-Teams gefördert werden, um den Wettbewerb spannend zu halten. Würde man einfach die Punktzahlen aller Teammitglieder zusammenzählen, hätte das größte Team den größten Vorteil, ein Einzelkämpfer hingegen keine Chance.
Nach der aktuellen Regel werden alle Teams so bewertet, dass ein Teilnehmer in einem 3er-Team bei gleicher Leistung auch die gleichen Chancen auf den Sieg hat wie ein Teilnehmer in einem 6er-Team. Wenn also in einem 3er-Team jeder 300 Punkte macht und in einem 6er-Team jeder 300 Punkte macht, liegen beide gleichauf. Ich finde das fair. Für Einzelkämpfer und Duos greift diese Regel nicht, sonst wäre es ja am schlausten, als Einzelkämpfer anzutreten. -- Zacke Neu hier? 13:25, 14. Feb. 2012 (CET)
Wieso hat ein größeres Team mehr Chancen als ein kleineres? Zunächst einmal arbeiten ja nie alle Teammitglieder auf dem selben Niveau, weshalb sich die Bereitschaft, unendlich große Teams zu bilden, in Grenzen halten dürfte. Wenn einfach die Endpunktzahl durch die Zahl der Teilnehmer geteilt wird, haben Teilnehmer kleinerer Teams trotzdem mehr Chancen, weil dann die eigenen Anstrangungen automatisch mehr zählen; ein achtköpfiges Team kann ich dagegen allein auch nicht bis ganz nach oben ziehen. Wenn beispielsweise in einem drei Leute Team 100 + 80 + 90 Punkte erbracht werden, sind das bei derzeitigem Stand 270 Punkte, wenn in einem Vier-Leute-Team 100 + 80 + 90 + 1 Punkte erbracht werden, wird die Gesamtleistung nicht nur durch den einen Durchhänger gemindert, sie wird auch noch durch vier geteilt und dann nur mit drei multipliziert, womit am Ende nur müde 202,5 dabei rumkommen. Bei acht Teilnehmern und dem doppelten ursprünglichen Ergebnis (jeder leistet also im Schnitt das gleiche) kämen trotzdem nur 202,5 Punkte raus. Ich verstehe einfach nicht ganz, warum Drei-Punkte-Teams derart stark bevorteilt werden (ist das irgendwie wünschenswert, dass die Leute maximal zu dritt zusammenarbeiten?); da hat man ja als Einzelkämpfer so oder so das Nachsehen. Würde einfach das Endergebnis durch die Zahl der Teammitglieder geteilt (auch bei kleinen Teams, für Einzelkämpfer würde sich ja nichts ändern), könnte sich jeder frei überlegen, ob er lieber alleine oder mit anderen mitmacht. Mir persönlich macht die Arbeit in größeren Teams einfach mehr Spaß als alleine vor mich hinzukrebsen. Die Punkte sind mir dabei eigentlich nicht so wichtig (und wenn dann schiele ich vor allem auf die umfangreichste Überarbeitung), aber irgendwie isses dann doch frustrierend, wenn man von Anfang an weiß, dass man keine Chance hat.--Toter Alter Mann 13:40, 14. Feb. 2012 (CET)

siehe http://de.wikipedia.org/wiki/Wikipedia_Diskussion:Wartungsbausteinwettbewerb/Archiv/2009#Meinungsbild_zur_L.C3.B6sung_der_Gruppenbonusproblematik_I. Ich denke, die Regel hat sich bewährt. Siehe auch das Folgemeinungsbild. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 16:09, 14. Feb. 2012 (CET)

Die Regel hat sich definitiv nicht bewährt wenn es damit größere Unzufriedenheiten gibt. Und zumindest die Bioredaktion ist damit sehr unglücklich. Wir haben das gestern nochmal im Chat diskutiert. Auch wenn bislang nur TAM und ich uns hier geäußert haben. Und wenn die besonders großen Teams wegfallen weil sie sich durch die regeln benachteiligt fühlen, fällt auch ein besonders großer Teil der Überarbeitungen weg. Bislang haben sich in jedem Fall noch keine Biologen angemeldet. --Ixitixel 08:10, 15. Feb. 2012 (CET)
Irgendjemand wird sich stets benachteiligt fühlen, das liegt in der Natur des Menschen. Dass der Großteil der Teilnehmer die Regel als die sinnvollste der bisher in Betracht gezogenenen ansieht, sollte den beiden Meinungsbildern zu entnehmen sein. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 10:52, 15. Feb. 2012 (CET)

Finde ich sehr schade. Ich ziehe für mich den Schluss daraus, dass ich dann eben informelle Teams mit den Leuten bilden werde, mit denen ich zusammenarbeiten möchte.--Toter Alter Mann 11:43, 16. Feb. 2012 (CET)

Dass Dreierteams (stark) bevorteilt werden, ist übrigens falsch. Ein Durchhänger in einem Dreierteam ist so schwerwiegend wie ein Durchhänger in einem größeren Team. Das Arsch-der-Gruppe-Problem lässt sich nur durch einen reinen Einzelkämpferwettbewerb lösen. Wäre aber ziemlich langweilig und wenig dynamisch. Wurde meines Erachtens aber schon mehrfach ausgiebig diskutiert, als Quintessenz hat sich die aktuelle Regel ergeben. Die Diskussion darüber immer wieder neu aufzurollen, ist anstrengend, zumal die in den Meinungsbildern nachzulesenden Argumente und Voten eindeutig in eine Richtung gehen. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 12:29, 16. Feb. 2012 (CET)

funktioniert nicht

Hallo und Entschuldigung für meinen erneuten Totalausfall.

Der aktuelle Bewertungsvorgang kann durch folgende Begriffe charakterisiert werden: Hektik, Überlastung, Bürokratie, Chaos, Frustration.

Der Fehler liegt weniger bei den Schiedsrichtern, sondern vielmehr im Bewertungssystem selbst, das allzu ausufernd geworden ist.

Mein Fazit: Es funktioniert nicht.

Deshalb rege ich zu einer Sammlung von Alternativvorschlägen an, die das Verfahren deutlich vereinfachen sollen/müssen. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 13:23, 18. Mär. 2012 (CET)

RL geht vor. Frühere Bewertungsvorgänge waren noch langwieriger. Was im Moment erschwerend hinzukommt, war die ebenfalls dem RL geschuldete etwas chaotische Hin- und Herverteilung der Beiträge der Teams, die zudem recht unterschiedlich ausfallen konnten. Die ordnende Hand des Oberschiedsrichters fehlte ziemlich und es war nicht besonders weise den B-Schiedsrichter dergestalt zu gängeln, auch wenn dies sicherlich nicht beabsichtigt war. Letztlich entscheidend ist es aber, wie es beim Adressaten ankam: Funkruf wollte ja kurzzeitig alles in der WP hinwerfen...
Etwas anderes läge mir selbst viel mehr am Herzen: Dass sich hier jeder an die Selbstverpflichtung hält und nicht die Artikel vor dem eigentlichen Wettbewerbszeitraum offline bearbeitet/vorbereitet! Diese Unsitte ist vom Schreibwettbewerb und dem Artikelmarathon her bekannt. Jeder, der hier bisher teilgenommen hat, kann den Umfang der Arbeit einigermaßen einschätzen. Schaut man sich dann an, in welchem zeitlichen Abstand umfangreiche oder zahlreiche Änderungen "herausgehauen" werden, kann da etwas nicht stimmen. Diesen daraus resultierenden Auswertungsstau dann dem Bewertungsssystem, das ganz andere themenbedingte Mängel hat (Vergleichbarkeitsproblem: Äpfel vs. Birnen vs. Erbsen), und den Schiedsrichtern in die Schuhe zu schieben, halte ich für verfehlt. --Laibwächter (Diskussion) 18:17, 18. Mär. 2012 (CET)
Anders als Nikkis bin ich der Meinung, dass das Bewertungssystem eigentlich ganz gut funktioniert bzw. funktionieren könnte, wenn nicht A- und B-Schiedsrichter gleichzeitig wegbrechen, was nun unglücklicherweise zum 2. Mal hintereinander passierte. Ich denke, wir können das 10-Schiedsrichter-Bewertungssystem im Zusammenspiel mit den derzeitigen Bewertunskriterien überhaupt nicht richtig beurteilen, weil es noch nie wirklich zum Einsatz kam.
Von Hektik bzw. Überlastung bei der Auswertungsarbeit habe ich z. B. während des gesamten Wettbewerbs und der darauffolgenden Woche nichts gemerkt. Im Gegenteil, ich habe eigentlich immer darauf gewartet, dass mir mal endlich ein paar Artikel zur Bewertung zugeteilt werden, doch das passierte eben nicht bzw. kaum. --  Sir Gawain Disk. 11:07, 20. Mär. 2012 (CET)
Ich kann mich Sir Gawains Einschätzung eigentlich nur anschließen. Weder empfand bzw. empfinde ich das Bewertungssystem als zu detailliert (mithilfe der Vorlage ist es ja sogar einfacher geworden) noch die Doppelbelastung Schiri/Artikelverbesserer zu stressig. Dabei führe ich sogar noch eine selbstgebastelte, händische Bewertungsliste nebenher. Es kann also, wie auch Sir Gawain schon vermutut, nur daran liegen, dass eben in den beiden bisher gelaufenen 10-Schiri-WBWs die ein bzw. zwei delegierenden Hauptschiedsrichter ausgefallen sind.
Die unten genannten Vorschläge 1 und 2 würde ich jedenfalls nicht unterstützen. Ersterer ist viel zu willkürlich und weder mess- noch prüfbar und beim zweiten würde ich jetzt schon drauf wetten, dass sich kein Schiri mehr finden lässt. Übrigens brauche ich z.B. für meine Überarbeitungen regelmäßig zwischen drei und vier Stunden (manchmal sogar mehr), schon allein wegen der Recherche bezüglich Namensgeschichte und besserer Bilder, falls auf Commons keine guten sind. Ich lass mich aber dennoch lieber anhand der im Artikel festgehaltenen Ergebnisse messen, weil ich keine Lust hätte, auch noch regelmäßig auf die Uhr gucken zu müssen. Gruß -- Ra'ike Disk. LKU WPMin 12:50, 20. Mär. 2012 (CET)

1. Vorschlag

  1. Die Teilnehmer führen bei der Ergänzung des Artikels in der Wettbewerbstabelle (1=Artikelname, fortlaufende Nummerierung) auf, wieviel Zeit sie (ungefähr) für die Überarbeitung investiert haben (Einheit: Minuten, Parameter: |1Z=...). Falls jemand der Ansicht sein sollte, er hätte im Vergleich zu anderen mehr oder weniger effizient gearbeitet, kann er entsprechend mehr oder weniger Minuten angeben. Dies kann durch den Pameter |anm=... begründet werden. Des Weiteren vermerken die Teilnehmer den entfernten Wartungsbaustein oder weisen alternativ auf die abgearbeitete Wartungsliste hin (Parameter: |1WB=...).
  2. Jeder mit mindestens einer Teilnahme (keine Regel, sondern nur Richtlinie) kann sich am Bewertungsprozess beteiligen. Es erfolgt keine detailgenaue Auszählung, sondern nur ein kurzer, aufmerksamer Prüfblick. Als Orientierung kann der Schiedsrichter hierbei die Angabe des Teilnehmers hinzuziehen, die - sollte kein offensichtliches Missverhältnis zwischen Aufwand und erarbeitetem Mehrwert bestehen - als Bewertungsmaßstab dient. Im Durchschnitt kommen auf eine Stunde Arbeit etwa zwanzig Punkte. Ein Artikel kann von maximal fünf Schiedsrichtern einer Bewertung unterzogen werden. Der Parameter |1anmSR=... ermöglicht, ein Bewertungskommentar zu hinterlassen. Falls ein Artikel von niemandem bewertet wird, beruht die Punktevergabe allein auf der Zeitangabe des Teilnehmers.

Modell: |12=Muster|12Z=60|12WB=qa|12anm=endlich fertig abgezogen|12SR1=A|12SR1!=20|12SR2=B|12SR2!=23|12SR3=C|12SR3!=21|12SR4=D|12SR4!=18|12SR5=E|12SR5!=20|12anmSR=gute Überarbeitung!--B

Bedeutung: Der Teilnehmer ergänzt den Artikel Muster. Dieser ist der zwölfte Artikel, den sein Team verbessert und eingetragen hat. Für die Überarbeitung hat er 60 Minuten benötigt und dabei den Wartungsbaustein Belege fehlen entfernt. Die Anmerkung endlich fertig kann natürlich weggelassen werden, sie soll hier nur als Beispiel dienen. Der erste bewetende Schiedsrichter Benutzer:A hat den Artikel mit 20 Minuten bewertet, die Zeitangabe des Teilnehmers also als genau zutreffend empfunden. Vier weitere Schiedsrichter haben 23, 21, 18 und 20 Punkte vergeben, der Schiedsrichter Benutzer:B hat eine lobende Anmerkung hinterlassen.

Der Wettbewerb läuft über einen Zeitraum von 15 Tagen, wobei den besonders aktiven Schiedsrichtern (allen mit mindestens 100 Bewertungen bis zum Wettbewerbsende) noch zwei Zusatztage als Kompensation zur Verfügung stehen. Artikel vom eigenen Team dürfen nicht bewertet werden, zudem sollte jeder Schiedsrichter Artikel von verschiedenen, bestenfalls allen Teams übernehmen. Bewertungsschluss ist am Tag nach dem definitiven Wettbewerbsende um 24 Uhr.

--Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 13:23, 18. Mär. 2012 (CET)

Eine derartige Selbsteinschätzungs-Punktvorgabe/Vergabe erinnert mich an das Scherbengericht-Benotungssystem meiner Alt-68er Deutschlehrerin („schildert mal eure Selbsteinschätzung – und dann diskutiert die ganze Klasse darüber!“ Steilvorlage für kindliches Mobbing), das für alle Beteiligten in Stress und Frustation ausartete.
Das entscheidende wäre wahrscheinlich die Aufwandsbepunktung. Es wird bestimmt nur in wenigen Fällen vorkommen, dass jemand meint, er hätte besonders (in)effizient gearbeitet. Diskutieren müssten wir allerdings noch, ob Pinkelpausen erlaubt sind. Bei Stuhlgangsproblemen wohl eher nicht ;-).
Aber nochmal im Ernst: Dieser Weg erscheint mir als die einzige Möglichkeit, den Bewertungsaufwand eindeutig zu reduzieren. Ich bin sehr dafür, diesen oder einen ähnlichen Vorschlag zu testen, denn klar sollte sein, dass der Wettbewerb mit dem aktuellen Bewertungsmodell keineswegs rund läuft. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 12:57, 19. Mär. 2012 (CET)
Das es mit dem aktuellen Bewertungsmodell im Moment schleppend (bei den beiden letzten Wettbewerben war es noch schlimmer) läuft, liegt aber eher daran, dass die ordnende Hand fehlte. Denn der erste Schwung war ja recht schnell bewertet. Wenn den Newbie-Schiedsrichtern niemand mehr neue Artikel zuteilt, auch auf Zuruf nichts passiert, wird sich kaum jemand rühren. Andererseits meinten vor diesem Wochenende sechs Schiedsrichter, wie würden an den Bewertungen weiterarbeiten, tatsächlich haben sich aber nur drei bewegt, was sicherlich auch den höchst unterschiedlichen zu bewertenden Artikelgruppierungen lag. --Laibwächter (Diskussion) 13:08, 19. Mär. 2012 (CET)
Als ein Problem betrachte ich auch die detailreiche Erbsenzählerei. In der Tat kann man einiges schlecht miteinander vergleichen. Deshalb ist der Zeitaufwand eigentlich ein sehr fairer Faktor, kombiniert mit einer Überprüfung des Schiedsrichters in Hinblick auf Qualität und erarbeitetem Mehrwert zudem auch noch leistungsgerecht. Schwierig ist der kurze Prüfblick natürlich schon, die Genauigkeit geht verloren, und doch gehe ich davon aus, dass es insgesamt ähnlich gerecht wie im jetzigen System, aber auf jeden Fall unbürokratischer, unkomplizierter und eindeutig schneller ablaufen kann. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 13:22, 19. Mär. 2012 (CET)
Wie lange braucht ihr eigentlich derzeit für eine Auswertung? So im Schnitt? Oder testet mal anhand davon und davon. -- Zacke Neu hier? 13:43, 19. Mär. 2012 (CET)
Die Nordsee von oben: 8 min, Michael Kenyon: 7 min; Abweichung bei der Bewertung: max. Punkte 2. -- Gruß  Sir Gawain Disk. 11:27, 20. Mär. 2012 (CET)
Die Nordsee von oben 7 min, wobei ich tatsächlich nahezu identisch wie Harro gewertet hätte (bei mir ist einer der Ref-Punkte unter WL gelandet), Michael Kenyon habe ich mir erspart, weil es einer meiner Artikel war. Was übrigens auch erschreckend viel Zeit benötigt, ist das lange Laden unserer geliebten Wikipedia-Seiten (gefühlte 2 Minuten bei der Auswertungsseite) ;-) --Laibwächter (Diskussion) 12:23, 20. Mär. 2012 (CET)
Hmmm, ich habe bei gleicher Bewertungszeit (ca. 7-8 min) eine leicht differierende Wertung bei beiden Artikeln:
  • Die Nordsee von oben: F=0,5 | Ib/PD=1 | Web=1 | Ref=6 | Inh=24,5 macht zusammen 33,00 (32.5)
  • Michael Kenyon: F=0,5 | D=1 | Ib/PD=1 | Web=1 | Lit=1 | Ref=7 | Inh=14,0 | S=0,25 (Kat) macht zusammen 25,75 (31.75)
Bei Michael Kenyon stellt sich mir vor allem die Frage, wie man auf 4 Infobox/PD-Punkte kommt, wo es doch pro Parameter nur 0,25 Punkte gibt (bei 4 PD-Wertkorrekturen also zusammen nur 1 Punkt). Gruß -- Ra'ike Disk. LKU WPMin 13:29, 20. Mär. 2012 (CET)
Für das Bild gibst du 1 Punkte? Für von en: auf Commons (z.B. Schlacht von Deorham) manuell hochgeladene Bilder rechne ich drei Punkte.
Nachdem ich eben François I. de Clèves, duc de Nevers (6 min), Ecgberht II. (Northumbria) Schlacht von Deorham (7 min), Leofwine Godwinson ausgewertet habe, stoppte ich auch die Zeit beim Eintrag in die Detailauswertung (10:15 min) und die Vorderseite inkl. Zwischenwertung (5 min). --Laibwächter (Diskussion) 14:20, 20. Mär. 2012 (CET)
Ich habe für beide Artikel mit simulierter Eintragung etwa 5 min. gebraucht mit leicht abweichendem Ergebnis zu Harros Bewertung bzw. meiner eigenen (ca. ein Punkt). Ich rechne mal einfach drauf los: Wenn man unsere Zeiten so vergleicht, liegt der Arbeitsaufwand also etwa bei 1 Minute pro 4 Punkte. Größere und sehr kleine Überarbeitungen (Koordinaten) benötigen wahrscheinlich mehr Zeit pro Punkt. Macht ca. 24 Stunden Auswertungszeit beim aktuellen Wettbewerb. Kommt mir wenig vor, hab ich mich verrechnet? @Ra'ike: Die 4 Ib-Punkte ergeben sich aus der Bibliographie. In den Kriterien wird das unter Tabellenpunkte zusammengefasst und auf die Ib-Punkte angerechnet. @Laibwächter: Bei der Größe der Auswertungsseite sollten wir uns vielleicht wirklich mal was Ladezeit-sparenderes ausdenken. -- Zacke Neu hier? 15:06, 20. Mär. 2012 (CET)
@Laibwächter: Sorry, bei dem ergänzten Bild von Michael Kenyon hatte ich übersehen, dass es frisch nach Commons geladen worden ist (existieren tut es ja schon seit 2006). Demnach stehen dem neuen, eingebunden Bild 5 Punkte zu (4 für den 1. Upload zum selben Artikel + 1 Einbindung), die es ja auch gekriegt hat.
@Zacke: Laut WBW-Kriterien gelten für alle Infoboxen und Tabellen dieselben Bedingungen. Personendaten werden als Infobox gewertet. Pro Segment gibt's (im Durchschnitt) 0,25 Punkte. Die Bibliographie (Werke) ist in diesem Sinne weder Infobox noch Tabelle. Ich habe sie deshalb, wie es in den Kriterien steht, als inhaltliche Erweiterung gewertet (Kriterien-Inhalt: Die Erstellung von Listen wird nach der selben Vorgehensweise gewertet: dabei kann es hilfreich sein, in der Vorschau die Aufzählungspunkte zu löschen, damit der Text in einer Passage dargestellt wird und bequemer abgezählt werden kann.), deshalb habe ich auch 14 Punkte (statt der gewerteten 12.5). Gruß -- Ra'ike Disk. LKU WPMin 13:30, 21. Mär. 2012 (CET)
Na gut, hab ich Laibwächter halt insgesamt zwei Punkte geschenkt. :) Vor dem nächsten Wettbewerb schau ich mir die Kriterien nochmal genauer an und änder vielleicht ein bisschen die Parameter in der Vorlage. -- Zacke Neu hier? 14:44, 21. Mär. 2012 (CET)

2. Vorschlag

Es werden sich unmöglich zehn Leute finden lassen, die sich bereit erklären, auf eine Wettbewerbsteilnahme zu Gunsten der Auswertung zu verzichten. Bereits die Suche nach drei vollen Schiedsrichtern gestaltete sich schwierig. Der Vorschlag erscheint mir in seiner Umsetzbarkeit unmöglich. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 12:57, 19. Mär. 2012 (CET)
Früher haben das Ganze zwei bis drei Schiedsrichter gestemmt. Die erforderliche Anzahl bekommt man zusammen, wenn die drei Erstplatzierten (beider Kategorien, also Teams und Einzelkämpfer) eines Wettbewerbs dazu verpflichtet werden beim nächsten Wettbewerb die Schiedsrichter zu spielen. Man hätte keine Seriengewinner mehr, mehr Abwechslung und jeder könnte sich mit der Rolle abfinden. Unmöglich ist nur mangelhafte Koordination. --Laibwächter (Diskussion) 13:03, 19. Mär. 2012 (CET)
Zwangsrekrutierungen? Mit Verpflichtung geht gar nichts, das kann ich dir versichern. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 13:22, 19. Mär. 2012 (CET)
Meint ihr nicht, wir finden 3 bis 4 Freiwillige, die den Job machen? Man kann ja die Gewinner freundlich fragen, ob sie beim nächsten Wettbewerb nicht fairerweise auch mal den Schiedsrichterposten übernehmen wollen. -- Zacke Neu hier? 13:29, 19. Mär. 2012 (CET)
Wg. BK: So stelle ich mir das auch eher vor – als freundliche Verpflichtung der allgemeinen Fairness gegenüber. --Laibwächter (Diskussion) 13:40, 19. Mär. 2012 (CET)
Drei bis vier Freiwillige lassen sich gelegentlich auftreiben, aber niemals durchgängig. Die Anzahl der Personen, die Lust auf diesen Vollzeitposten haben, ist stark limitiert. Ich selbst zähle mich inzwischen auch nicht mehr zu diesem Personenkreis. Bereits die Suche nach drei Personen war ein absoluter Kraftakt. Und drei Schiedsrichter genügen nicht, um den Bewertungaufwand pro Kopf erträglich zu machen. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 13:38, 19. Mär. 2012 (CET)
Auch wenn es unter dem Deckmäntelchen "der freundlichen Nachfrage" daherkäme: Ich würde an keinem WBW mehr teilnehmen, wenn ich mich damit zwangsweise verpflichten würde, beim nächsten Wettbewerb, auf dessen Zeitpunkt und -raum ich nur sehr begrenzt Einfluss habe, als hauptamtlicher Scheidsrichter zur Verfügung zu stehen. Ich kann doch heute nicht abschätzen, ob und wann ich in grob drei Monaten Zeit haben werde, so einen Job zu machen. Von der Lust bzw. Unlust, so einen Posten zu übernehmen, mal ganz abgesehen. Gerade der recht hohe Zeitaufwand, der über einen relativ langen Zeitraum (2-4 Wochen) für eine sehr monotone Arbeit von wenigen Bewertern zu bewältigen war, war doch der Grund, dass sich schlussendlich keine hautpamtlichen Schiris mehr gefunden haben. -- Gruß  Sir Gawain Disk. 11:43, 20. Mär. 2012 (CET)
@Laibwächter: Irgendwas muss in den letzten Tagen an mir vorbeigegangen sein: Kannst du mir vielleicht einmal ein, zwei Postings nennen, aus denen hervorgeht, dass die Doppelbelastung, Schiri und Teilnehmer zu sein, zu Konkurrenzdenken geführt hat? -- Gruß  Sir Gawain Disk. 11:43, 20. Mär. 2012 (CET)
@Gawain: Warum hat sie mir die Frage nicht direkt gestellt, wenn ich sie auf der Auswertungsseite darauf anspreche? CatMan hat dann die Frage für sie geklärt, aber ideale Kommunikation war das nicht. Und erneut – können wir das nach dem Wettbewerb klären? Sonst sinkt meine Motivation die Auswertungen voranzutreiben gegen Null. --Laibwächter (Diskussion) 12:10, 20. Mär. 2012 (CET)

3. Vorschlag

Die Teilnehmer sortieren ihre Überarbeitungen sofort bei der Eintragung der Artikel in die Wettbewerbstabelle selbst nach Klassen ein, die nicht fest definiert sind, sondern teamspezifisch ausfallen. Das heißt, alle Überarbeitungen, die nach Ansicht der Teilnehmer bzw. Teams einen ähnlichen Aufwand bereitet und Mehrwert erbracht haben, finden sich teamintern in einer Klasse wieder. Die Anzahl der Klassen ist unbegrenzt. Die Schiedsrichter bewerten nur ca. 1/4 der Artikel jeder Klasse, die der A-Schiedsrichter (der die Klasseneinteilung bestenfalls korrigierend begleiten solle) zufällig auswählt. Bewertet wird nach dem alten Modell.

Beispielteam1:

  • Klasse 1: A, B (5), C, D (7), E, F, G = 6 Punkte für jeden Artikel (7*6==42)
  • Klasse 2: H, I (17), J, K, L, M, N (16), O, P = 16,5 Punkte für jeden Artikel (9*16,5=148,5)
  • Klasse 3: Q, R, S, T (32), U, V, W, X (28) = 30 Punkte für jeden Artikel (30*8=240)

Beispielteam2:

  • Klasse 1: A (1), B , C, D (0,5), E, F, G, H = 0,75 Punkte für jeden Artikel (8*0,75=6)
  • Klasse 2: I , J, K (7), L, M (4), N = 5,5 Punkte für jeden Artikel (6*5,5=33)
  • Klasse 3: O, P, Q (13), R, S, T, U (17) = 15 Punkte für jeden Artikel (7*15=105)
  • Klasse 4: V (20), W, X = 20 Punkte für jeden Artikel (20*3=60)
  • Klasse 5: Y, Z (31) = 31 Punkte für jeden Artikel (31*2=62)

Der Schiedsrichter hat nur jeden vierten Artikel bewertet und auf dieser Grundlage für jede Klasse eine Punktzahl vergeben, die mit der Anzahl der in ihr enthaltenen Artikel multipliziert wird (bewertet wird durchgängig mit Cuts).

Die Umfangreichsten Überarbeitungen werden nach dem Wettbewerb durch Abstimmung auf der Diskussionsseite ermittelt.

Verbinden kann man diese Reform noch mit der Änderung, dass für virtuelle Wartungsbausteine (und während des Wettbewerbs vom Teilnehmer selbst gesetzte Wartungsbausteinen) konsequent die halbe Punktzahl vergeben wird. Damit könnten wir uns bei jedem Wettbewerb nervige Diskussionen um Auslegungsfragen ersparen.

Sorry, dass ich jetzt doch wieder während des laufenden Wettbewerbs mit der Ideensammlung anfange. Dies nur als Notiz, damit ich den Einfall nicht vergesse... --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 03:52, 20. Mai 2012 (CEST)

Ist doch in Ordnung... Ideensammlung ist immer gut. Allerdings verstehe ich kein Wort von deinem Vorschlag... --Gripweed (Diskussion) 12:58, 20. Mai 2012 (CEST)
Wo hakt's? --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 13:03, 20. Mai 2012 (CEST)
Mir fehlt der Sinn einer Klasseneinteilung, der Bewertungsvorgang ergibt für mich wenig Sinn. Wie errechnet sich die Punkteverteilung? Wo bleibt die Objektivität, wenn ich in Klasse 1 nach altem Modell einen Artikel hätte, der sage ich mal 40 Punkte gebracht hätte und mein Teamkollege einen reinschiebt der 24 Punkte brächte und der Schiedsrichter nur dessen Artikel bewertet? Zudem erscheint mir das System viel zu kompliziert. --Gripweed (Diskussion) 13:44, 20. Mai 2012 (CEST)
Komplizierter als das jetzige ist es insofern, dass die Teilnehmer eine Art Vorarbeit (Klasseneinteilung) machen müssen, aber zu beachten ist der drastisch reduzierte Zeitaufwand für die Schiedsrichter (1/4). Ich habe den Eindruck, du hast meine Idee schon gut verstanden, sonst hättest du nicht die berechtigte Frage Wo bleibt die Objektivität, wenn ich in Klasse 1...? gestellt. Das könnte man abfedern, indem der A-Schiedsrichter die Klasseneinteilung der Teams überprüft und wenn nötig ändern kann, falls er der Meinung ist, dass der Aufwand und erarbeitete Mehrwert innerhalb einer Klasse von Artikel zu Artikel sehr stark schwankt (dann würde er die Klasse splitten können). Klar ist, dass mit einer solchen stichprobenartigen Bewertung die jetzige (absolute) Genauigkeit abhanden kommt. Allerdings: Ohne Reduzierung der Genauigkeit kann auch der Zeitaufwand nicht reduziert werden, das ist ja das Dilemma, in dem wir hier stecken. Um eine Reduzierung des Zeitaufwands für die Schiris kommen wir aber nicht drum herum, wenn die langfristige Durchführbarkeit unseres Wettbewerbs sichergestellt werden soll (ich sehe sie momentan gefährdet). Anders als bei Vorschlag 1 handelt es sich hier um keine Revolution im Sinne einer kompletten Umwälzung des Systems, sondern um eine Reform. Ich kann mir insofern vorstellen, dass dies ein Kompromiss sein könnte zwischen der konservativen und revolutionären Fraktion. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 14:13, 20. Mai 2012 (CEST)

4. Vorschlag

Die Bewerterei ist sicherlich das Eine, das man verbessern kann. Aber was mir jetzt wieder auffällt, das Herumhantieren mit den Vorlagen, Wertungsseiten, Abschnitten etc. finde ich unnötig kompliziert und unübersichtlich. Meine Idee wäre, dass die Teilnehmer ihre Beiträge in eine Art Fließband eintragen, und zwar nicht nur den Artikelnamen, sondern eben gleich die Bewertungsbox mit Artikelname, entferntem Baustein, Teamname. Die Schiris schnappen sich dann (könnte man dann sogar möglichst chronologisch machen) eine vorausgefüllte Box, bewerten und tragen ein. Dann könnte man es eventuell sogar den Teams selbst überlassen, fertige Boxen vom Fließband zu nehmen, in die Detailseite zu verschieben und die Wertungen auf die Ergebnisseite zu übertragen. -- Harro 03:40, 22. Mai 2012 (CEST)

Die zunehmende Kompliziertheit für die Teilnehmer steht meines Erachtens nicht im Gleichgewicht mit einer entscheidenden Reduzierung des Bewertungsaufwands. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 11:27, 4. Jun. 2012 (CEST)
Harros Idee empfinde ich vom Prinzip her gut, da wir inzwischen mit Minibausteinüberarbeitungen zugeschüttet werden: der Vorlagenaufwand ist jedoch stets identisch. Beim Wikicup funktioniert der eigenveranwortliche Selbsteintrag sogar in noch größerem Aufwand. IMHO empfinde ich es für die Teilnehmer weniger kompliziert als für die Schiedsrichter. Im Gegenteil: wir werden ständig mit neuen Wünschen nach zusätzlichen Bausteinwertungen und virtuellen Bausteinen konfrontiert, die mitunter über das Ziel hinausschießen oder sich überhaupt nicht mehr die Mühe machen, im Vorhinein nachzuhaken. --Laibwächter (Diskussion) 11:42, 4. Jun. 2012 (CEST)

Rückzug

Liebe WBW-Teilnehmer und Kollegen,

ich habe ja viele WBW miterleben dürfen (als Teilnehmer oder als Schiedsrichter). Allerdings stelle ich mit der Zeit fest, dass ich für den WBW nicht mehr aktiv werden kann. Nachdem ich nun auch in einer anderen Arbeit tätig bin, kann ich allerhöchstens noch verwaltungstechnische Arbeiten in Wikipedia machen, da ich auch auf der Arbeit ins Internet darf, aber nicht dauernd einen Monitor mit mir rumschleppen möchte, da ich ein Netbook nutze. Daher habe ich nun beschlossen, dass ich aus dem Wettbewerb zurücktreten werde und nicht mehr zur Verfügung stehe. Trotzdem möchte ich natürlich allen danken, die hier mitgewirkt haben, auch besonders Harro mit dem ich 2x im Team sein dürfte (und dazu auch 1x gewonnen habe). Ich wünsche euch weiterhin viel Freude und das die Bausteine purzeln mögen. Funkruf WP:CVU 18:59, 2. Apr. 2012 (CEST)

Hallo Funkruf,
vielen herzlichen Dank für alles, was du für den WBW geleistet hast, als Verbesserer wie als Bewerter und Organisator. Das richtige Leben macht einem eben Einschränkungen, wieviel Zeit und Gelegenheit einem für ein lieb gewordenes Hobby bleibt, das erleben die meisten von uns. Ich hatte selbst noch gar nicht so lange eine Krise, als meine WP-Vorhaben einfach zu viel wurden und der Stress-Level zu hoch stieg. Ich habe zu einer anderen Herangehensweise gefunden und damit auch wieder Spaß zurückgewonnen. Ich hoffe, dass dir hin und wieder etwas mehr Zeit für das WP-Hobby bleibt, obwohl ich dir natürlich auch wünsche, dass dir deine richtige Arbeit Spaß bringt. Vielleicht findet sich ja demnächst mal wieder die Gelegenheit, gemeinsam - ganz entspannt - mit einem "Keine-Zeit-Team" am WBW teilzunehmen, es würde mich freuen. Vielen Dank und alles Gute -- Harro 23:10, 2. Apr. 2012 (CEST)
Dank dir für deine Arbeit – vor allem als Schiedsrichter – und alles Gute in deinem Beruf! :) -- Zacke Neu hier? 11:57, 3. Apr. 2012 (CEST)
Ich möchte mich dem Dank anschließen. Real Life geht leider vor. Ich wünsche dir, einen neuen Zugang zu unserem gemeinsamen Hobby zu finden und hoffe, dass deine Lücke gfüllt wird. --Gripweed (Diskussion) 12:37, 3. Apr. 2012 (CEST)
Hallo Funkruf, wirklich schade, dass Du nicht mehr am WBW teilnehmen kannst bzw. willst, aber rL geht natürlich vor. Daher auch von mir alles Gute und hoffentlich sehe ich Dich wenigstens noch ab und zu auf der Beobachtungsliste blinken ;-) Viele Grüße -- Ra'ike Disk. LKU WPMin 12:42, 3. Apr. 2012 (CEST)
Hi Funkruf, tja was kann ich noch hinzufügen, was nicht bereits die Kollegen gesagt haben? Wir werden dich auf alle Fälle hier vermissen und irgendwie hatte ich es bei dir auch seit einem halben Jahr befürchtet. Aber insgesamt bleibts du ja – wenn auch im verminderten Umfang – der Wikipedia erhalten. Alles Gute für dein RL. SchöGru --Laibwächter (Diskussion) 14:11, 3. Apr. 2012 (CEST)
Wie gesagt, ganz verschwinden tue ich nicht. Ich habe ja die verwaltungstechnische Tätigkeit (Auswertung, SB-Kontrolle, CVU), den ich ja noch machen kann. Aber wie gesagt, es war mir eine große Freude, dem WBW beizuwohnen und auszuhilfen. Funkruf WP:CVU 19:49, 3. Apr. 2012 (CEST)
Liebe WBW-Mitglieder,
wie ich schon in der Disk beim Sommerwettbewerb mitgeteilt habe, werde ich wieder zurückkommen. Und zwar schon zum Herbstwettbewerb. Die Situation hat sich wieder etwas gebessert, sodass ich nun wieder bereit bin, mich im Wettbewerb zu arrangieren. Funkruf WP:CVU 21:27, 1. Okt. 2012 (CEST)
Klasse. Du musst dich auch ranhalten, Nikkis hat dir deinen Rang als Oberschiedsrichter streitig gemacht ;-) Vielleicht treffen wir uns ja in einem Team, würde mich freuen. Gruß -- Harro (il cane bau bau) 23:44, 1. Okt. 2012 (CEST)
Jo. Funkruf WP:CVU 13:01, 4. Okt. 2012 (CEST)

Terminfindung

darf ich eure aufmerksamkeit auf die von mir angeregte diskussion wegen der immer wieder problematischen terminkollision mit dem atikelmarathon aufmerksam machen: [1] ziel sollte sein, dass wir für beide bewerbe so fixe termine findet, die einander nicht im wege stehen. lg, --kulacFragen? 12:45, 4. Apr. 2012 (CEST)

Scheint ja jetzt geklärt, hier im Mai, Artikelmarathon im Juni. Wenn sich dort der zweite Termin (ab 8. Juni) durchsetzt, dann sollten wir auch innerhalb der nächsten vier Wochen starten. Bei den bisherigen vier Frühlingswettbewerben lag der Beginn zwischen 8. und 18. Mai. Wenn wir die oben angefangene Diskussion noch zu Ende führen wollen, dann müssten wir uns schon so langsam konkrete Gedanken machen. -- Harro 21:21, 18. Apr. 2012 (CEST)


Da ich schon mehrfach Stimmen dazu gelesen hatte, würde ich gerne bezüglich des Termins nochmal ein allgemeines Problem ansprechen. Wenn ich ehrlich sein soll, erscheint es mir nämlich mittlerweile insgesamt gesehen auch etwas zuviel, den WBW 4x im Jahr abzuhalten. Meist beharkt er sich ja auch noch mit dem Artikelmarathon. Wäre es denn eine Option, wenn wir den WBW zukünftig auch nur noch zweimal im Jahr stattfinden lassen?
Falls ja, wäre mein Vorschlag dann, den WBW als sogenannten "Frühjahrsputz" bzw. "Herbstputz" zu veranstalten. Das würde einerseits gut zu unserem Auftrag passen, die Bausteine wegzuputzen und andererseits dem Sommer- und Wintermarathon der Artikelanlagen nicht mehr in die Quere kommen. -- Ra'ike Disk. LKU WPMin 13:54, 19. Apr. 2012 (CEST)

Hallo, den Vorschlag hatten wir schon öfters. Ich bin eindeutig dagegen, weil es dann vermutlich zu einer noch stärkeren Beteiligung kommen würde. Genau genommen ist der Wettbewerb schon jetzt zu groß angesichts des gewaltigen Bewertungsaufwands. Dazu sollten wir die obige Diskussion nochmal aufgreifen. Begraben möchte ich den dortigen Vorschlag noch nicht, weil er mir als einzige Alternative zum jetzigen System erscheint. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 23:11, 24. Apr. 2012 (CEST)
Meine Meinung bezüglich der o.g. alternativen Bewertungsvorschläge hatte ich ja schon schon gepostet ;-) Gruß -- Ra'ike Disk. LKU WPMin 14:29, 26. Apr. 2012 (CEST)

Möglichkeiten

  • 4. Mai - 18. Mai
  • 11. Mai - 25. Mai
  • 18. Mai - 1. Juni

Wer am lautesten schreit, erhält wie immer den Zuschlag. ;-) --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 23:26, 24. Apr. 2012 (CEST)

Also, ich schrei eigentlich ungern, wäre aber für den 11. Mai - 25. Mai ;-) Gruß -- Ra'ike Disk. LKU WPMin 14:29, 26. Apr. 2012 (CEST)
Der erste Termin wäre für mich schlecht, da ich dann nicht teilnehmen könnte. Am liebsten wäre mir 18. Mai bis 1. Juni. --Laibwächter (Diskussion) 14:36, 26. Apr. 2012 (CEST)
Ich will auch mal teilnehmen, für mich wäre der 4. Mai bis zum 18. Mai am besten. --Lenni 2011 bewerten? 19:14, 26. Apr. 2012 (CEST)
Termin eins passt mir nicht gut und Termin drei spaltet wahrscheinlich in die, die an Pfingsten nicht können, und die, die gerade wegen Pfingsten können. Also stimme ich mal für 11. - 25. Mai. -- Harro 01:23, 28. Apr. 2012 (CEST)
Es scheint wohl in Richtung Termin2 zu gehen. Wer kann die Einladungen übernehmen? Bei mir geht zeitlich momentan nix. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 18:16, 30. Apr. 2012 (CEST)
Da Termin2 jetzt zu kurzfristig wäre und sich niemand ausdrücklich gegen Termin3 ausgesprochen hat, werde ich nun für diesen einladen. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 13:06, 7. Mai 2012 (CEST)

Inhaltsangabe auf der WBW-Diskussionsseite

Da meine Anfrage anscheinend weder hier noch beim letzten WBW so recht aufgefallen ist, spreche ich das Thema hier noch einmal allgemein an.
Ein kurzer Balken mit den Hauptüberschriften (Kapiteln) im Kopf sieht zwar ganz hübsch aus, ist aber zumindest aus meiner Sicht - und wohl auch aus der von Sir Gawain (siehe letzter WBW) - sehr unzweckmäßig, weil unübersichtlich. Ich würd's also gern wieder auf eine "richtige" Inhaltsangabe ändern wollen. Gruß -- Ra'ike Disk. LKU WPMin 12:54, 10. Mai 2012 (CEST)

Ja, kann man doch einfach per __TOC__ hinzufügen. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 13:03, 10. Mai 2012 (CEST)
Klar kann man per TOC lösen, aber es hätte ja sein können, dass es einen Grund gibt, die normale Inhaltsangabe zu unterdrücken ;-)
Übrigens wird der Diskussionskopf durch Deine Änderung jetzt verkürzt angezeigt, d.h. er geht nicht mehr über die ganze Seitenbreite. Ist das gewollt? Außerdem würde ich vorschlagen, die Inhaltsangabe unter die Box zu setzen, weil selbige sich ansonsten im Laufe des Wettbewerbs und der zunehmenden Anzahl der Abschnittsüberschriften immer weiter aufblähen würde. Gruß -- Ra'ike Disk. LKU WPMin 13:59, 10. Mai 2012 (CEST)
Ich war mal so mutig und hab's jetzt selbst nochmal angepasst ;-) Gruß -- Ra'ike Disk. LKU WPMin 12:40, 11. Mai 2012 (CEST)
Sieht gut aus. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 13:24, 11. Mai 2012 (CEST)

Regeln

Leider hat es ja etwas Verwirrung gegeben wegen der Regeln. Könnte die Hauptseite mal aktualisiert werden, damit dort die jetzt wirklich gültigen Regeln stehen? Danke...--Emergency doc (Diskussion) 09:41, 18. Mai 2012 (CEST)

Bereits geschehen. Da Nikkis mit Vorlagen arbeitet, war das Ganze ziemlich verschachtelt. Auf der Wettbewerbsseite sind zudem jetzt die Kriterien und die Hinweise für die Schiedsrichter verlinkt. Ganz abgesehen von der längst fälligen Angabe der Schiedsrichter. --Laibwächter (Diskussion) 10:16, 18. Mai 2012 (CEST)

Diskussion mit der Zielsetzung: starke Reduzierung des Bewertungsaufwands

Verehrte Mitstreiter, das in der Abschnittsüberschrift genannte Ziel ist, man könnte sagen, von immanenter Bedeutung, weil ich ohne ein funktionierendes, effektives Bewertungssystem die langfristige Zukunft des Wettbewerbs gefährdet sehe.

Oben habe ich in Hinblick auf das aktuelle Bewertungssystem bereits das Fazit funktioniert nicht gezogen, im Zuge dessen zwei Vorschläge eingebracht. Ich sehe, dass der eine als zu radikaler Einschnitt betrachtet und deshalb mehrheitlich abgelehnt wird. Okay. Daraufhin habe ich einen Vorschlag mit Reform- statt Revolutionscharkter getätigt, den ich hier noch einmal leicht modifiziert zitiere:


Die Teilnehmer sortieren ihre Überarbeitungen sofort bei der Eintragung der Artikel in die Wettbewerbstabelle selbst nach Klassen ein (und geben auch die entfernten Bausteine an), die nicht fest definiert sind, sondern teamspezifisch ausfallen. Das heißt, alle Überarbeitungen, die nach Ansicht der Teilnehmer bzw. Teams einen ähnlichen Aufwand bereitet und Mehrwert erbracht haben, finden sich teamintern in einer Klasse wieder. Die Anzahl der Klassen ist unbegrenzt, die Sortierung kann bis nach Wettbewerbsschluss geändert werden. Die Schiedsrichter bewerten nur ca. 1/4 der Artikel jeder Klasse, die der A-Schiedsrichter zufällig auswählt. Bewertet wird nach dem alten Modell.

Beispielteam1:

   Klasse 1: A, B (5), C, D (7), E, F, G = 6 Punkte für jeden Artikel (7*6==42)
   Klasse 2: H, I (17), J, K, L, M, N (16), O, P = 16,5 Punkte für jeden Artikel (9*16,5=148,5)
   Klasse 3: Q, R, S, T (32), U, V, W, X (28) = 30 Punkte für jeden Artikel (30*8=240)

Beispielteam2:

   Klasse 1: A (1), B , C, D (0,5), E, F, G, H = 0,75 Punkte für jeden Artikel (8*0,75=6)
   Klasse 2: I , J, K (7), L, M (4), N = 5,5 Punkte für jeden Artikel (6*5,5=33)
   Klasse 3: O, P, Q (13), R, S, T, U (17) = 15 Punkte für jeden Artikel (7*15=105)
   Klasse 4: V (20), W, X = 20 Punkte für jeden Artikel (20*3=60)
   Klasse 5: Y, Z (31) = 31 Punkte für jeden Artikel (31*2=62)

Der Schiedsrichter hat nur jeden vierten Artikel bewertet und auf dieser Grundlage für jede Klasse eine Punktzahl vergeben, die mit der Anzahl der in ihr enthaltenen Artikel multipliziert wird. Damit die Klaseneneinteilung unvoreingenommen, in Unwissenheit der einzelnen Bewertungen erfolgt, darf die Auswertungsseite bis zum Wettbewerbsende nicht verlinkt werden. Stattdessen veröffentlicht der A-Schiri regelmäßig Zwischenstände.

Die Umfangreichsten Überarbeitungen werden nach dem Wettbewerb durch Abstimmung auf der Diskussionsseite ermittelt.

Verbinden kann man diese Reform noch mit der Änderung, dass für virtuelle Wartungsbausteine (und während des Wettbewerbs vom Teilnehmer selbst gesetzte Wartungsbausteinen) konsequent die halbe Punktzahl vergeben wird. Damit könnten wir uns bei jedem Wettbewerb nervige Diskussionen um Auslegungsfragen ersparen.

Folgen: Es wird für die Teilnehmer (sie leisten eine Art Vorarbeit für die Bewertung) komplizierter. Ich sehe aber die Möglichkeit, diese zu tätigende Vorarbeit in einfacher Darstellung im Editintro der Wettbewerbsseite zu beschreiben. Die komplizierteste Tätigkeit liegt ohnehin beim A-Schiri, weil er der einzige ist, der das System wirklich durchschauen muss. Für die Schiedsrichter wird es nicht komplizierter, ihr Aufwand vierteilt sich.

Der Vorschlag sollte bereits im Sommerwettbewerb getestet werden (ich stelle mich als A-Schiri zur Verfügung), denn dieser ist angesichts der geringeren Teilnahmezahlen als Testlauf am idealsten. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 11:57, 4. Jun. 2012 (CEST)

Sorry, aber du hast die Kritikpunkte an jedem sich selbst klassifizierenden oder kalkulierenden Bewertungsmaßstab (das Problem der Selbsteinschätzung) noch immer nicht wirklich verinnerlicht. Jeder, der bisher im Durchschnitt um bzw. mehr als 30 Punkte für eine gute Bearbeitung bekommen hat und in der Regel auf jene mit gerade einmal einen Punkt pfeift, wird bei obiger Lösung dem Wettbewerb fernbleiben. Viel besser wäre es, wenn man wie beim Wikicup es den Teilnehmern bei Marginalbearbeitungen (Defekter Weblink, Koordinanten, Bild fehlt, etc.) den Eintrag im Sinne von AGF selbst "zu erlauben". Damit bekommt man schon einmal gefühlte 25% der Beiträge vom Tisch. Virtuelle Bausteine enfallen konsequent, sie können lediglich durch Portalwartungsseitenhinweise ersetzt werden. Noch etwas: auch jetzt ist der aktuelle Wettbewerb nocht nicht wirklich abgeschlossen, sprich ausgezählt, aber bereits jetzt sollen wir alle wieder hier diskutieren? Angestrebt war etwas anderes. --Laibwächter (Diskussion) 16:22, 4. Jun. 2012 (CEST)
  • einmal finde ich den hinweis die die artikel die im statischen 1/0,5/0,25-punkt schema bewertbar sind und nur solche änderungen enthalten, den teilnehmern selbst zu überlassen (weblink, Koordinate, fussnote usw.) diese sind mit kurzer anmerkung wie: 3xW, 1xK, 2xF = Beispiel für 3xWeblink, 1xKoordinate, 2xFussnote selbst zu setzen und werden von den schiedrichtern stichprobenartig überprüft
  • dann ließe sich durch das setzen der direkten zu bewertenden difflinks 1-2 arbeitsschritte sparen
  • so als vorschlag meinerseits Bunnyfrosch 16:37, 4. Jun. 2012 (CEST)
Genau in jene Richtung gingen ja Harros (Vorlageverwendung durch User) und meine Überlegungen (Marginalbearbeitungen). --Laibwächter (Diskussion) 16:44, 4. Jun. 2012 (CEST)

Missverständnis. Das ist kein Selbstbewertungssystem. Bewertungen werden allein von den Schiedsrichtern durchgeführt, keinesfalls von Teilnehmern. Jeder, der bisher im Durchschnitt um bzw. mehr als 30 Punkte für eine gute Bearbeitung bekommen hat und in der Regel auf jene mit gerade einmal einen Punkt pfeift, wird bei obiger Lösung dem Wettbewerb fernbleiben. Sorry, aber das Argument leuchtet mir auch beim dritten Mal durchlesen + überlegen nicht ein. Es werden nicht mehr 100 Prozent, sondern 25 Prozent der Artikel bewertet. Ansonsten ändert sich gegenüber dem aktuellen System nix. Im August stelle ich mich als A-Schriri zur Verfügung (es müsste auch zeitlich passen), alles was an Verkomplizierung dazu kommt, betrifft mehr oder weniger mich. Ihr müsst euch erstmal keine Sorgen machen, sondern nur die Artikel bewerten, die zugeteilt werden. Bzgl. der Feinlösung habe ich schon sehr konkrete Überlegungen getätigt, die ich bei Interesse darstellen kann (betrifft aber nur Tätigkeiten des A-Schiris). --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 17:55, 4. Jun. 2012 (CEST)

Also mal rein aus Schreibersicht muss ich sagen, dass ich mit den Klassen nicht klarkomme. Ich kann meine eigenen Arbeit nicht klassifizieren, nicht auf 10 Punkte genau. Ich mache die Arbeit, die zu tun ist, und freue mich einfach auf die Punkte. Sind es 32, denke ich mir, naja, sind es 52, dann freue ich mich besonders. Wenn ich selbst vorher herausfinden wollte, wieviele Punkte ich zu erwarten habe, dann liefe das darauf hinaus, dass ich meine Änderungen nach den Regeln bepunkten müsste, mit anderen Worten, auf eine Selbstbewertung. Für mich als Autor wäre dann eine Stoppuhrregel, wie diesmal am Anfang gedacht, noch deutlich besser. Nur weiß ich nicht, wie gerecht so etwas wäre, weshalb ich es gerne vorher (unverbindlich) getestet hätte.
Ich denke, was wir den Schreibern zumuten könnten, das wäre mein "Fließband" - statt den Artikelnamen in die Tabelle einzutragen (viele machen das bereits mit Kommentar), kriegen sie eine Fließbandzeile, wo sie den Artikelnamen (und den Kommentar) und zusätzlich den entfernten Baustein eintragen. Und dann werden alle Fließbandzeilen einer Gruppe zusammenkopiert (fortlaufend oder zum Abschluss), man hat endlich eine Tabelle, in der alle Einzelergebnisse untereinander stehen und unter dem Strich ein klar nachvollziehbares Endergebnis. Ich würge jedesmal mit der unübersichtlichen Artikelauflistung herum, muss das dann auch noch mit den ebenso unübersichtlichen Einzelartikelkästchen auf dem zweiten Bildschirm abgleichen, darf mich beim Zusammenrechnen nicht vertun und muss das alles dann noch umständlich und doppelt eintragen. Vom Aufwand her völlig überzogen. Und das immer, selbst wenn es nur um einen halben Koordinatenpunkt geht.
Und Laibwächters Idee fände ich ebenfalls zumutbar. Wer Standardarbeiten mit fixer Punktzahl macht, der schreibt das in seine Fließbandzeile gleich rein und der Bewerter kontrolliert und macht nur noch sein Signum dahinter. Wenn einer zehn Koordinaten macht, macht er nur eine Fließbandzeile mit den zehn Namen + Lagewunsch, trägt fünf Punkte ein und ich kucke kurz drüber und schreibe HvW dahinter. Selbst wenn mir das jeweils nur eine halbe Minute pro Artikel spart, bei hundert Artikeln sind das 50 Minuten lästiger Arbeit und zudem eine potenzielle Fehlerquelle weniger.
Und wenn wir uns ankucken, wo wir Zeit sparen können, dann müssen wir mal darüber reden, was denn eigentlich die Zeit kostet. Ich habe einfach ein ungutes Gefühl, drei Viertel der Artikel einfach durchzuwinken. Ich hatte mehrere Fälle, wo die Schreiber offenbar zufrieden waren, obwohl nicht nur ich, sondern auch andere Artikelleser das hinterher anders sahen. Bei 3:1 Wahrscheinlichkeit rutschten fast alle durch. Wo ich viel Zeit brauche, das ist bspw. beim Zeilen- oder beim Quellenzählen. Textkürzungen sind immer heikel, weil man da wirklich lesen und vergleichen muss. Boxeneinträge zählen und bewerten ist auch heikel, weil ich mich jedesmal frage, wie das wohl ein anderer Schiri sehen würde. Wenn wir da Regeln pauschalisieren und zusammenstreichen könnten, so dass sie einfacher und klarer wären - auch unter Inkaufnahme von mehr Ungerechtigkeit -, dann würde uns das, glaube ich, weiter bringen, als ein neues System, das vielleicht schneller anzuwenden, dafür aber ungenauer und weniger nachvollziehbar ist. -- Harro 23:44, 4. Jun. 2012 (CEST)
Also mal rein aus Schreibersicht muss ich sagen, dass ich mit den Klassen nicht klarkomme. Ich kann meine eigenen Arbeit nicht klassifizieren, nicht auf 10 Punkte genau. -- Es würde darauf hinauslaufen, dass halt doch ein klein wenig auf die Zeit geschielt wird. Und so ausreichend verfeinert, dass die Bepunktung einigermaßen zeitgerecht abläuft, sollten unsere Kriterien wohl ausgearbeitet sein. Bzgl. des Fließband- und Selbstbewertungssystems von kleinen Änderungen bin ich höchst skeptisch. Was sind kleine Änderungen? Wollen wir wirklich von allen Teilnehmern erwarten, sich die diesbezüglichen Kriterien durchzulesen? Warum sollte ich mir als Teilnehmer diesen Mehraufwand zumuten? Wo ist der Anreiz? Ist eine wirklich eindeutige Reduzierung des Zeitaufwands zu erwarten? Selbst wenn, ist diese mit der Komplizierung vereinbar? Selbst bei der Bewertung von Belegangaben wären Teilnehmer meines Erachtens bereits überfordert. Kurzum: Mir zu viele Fragezeichen. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 00:07, 5. Jun. 2012 (CEST)
Wenn sich an den Kriterien nichts ändert, sei es für alle, sei es für ein Viertel der Bewertungen, dann ändert sich an der Klassifizierbarkeit auch nichts, dann ändert sich auch nichts am Zeitfaktor. Und die Komplizierung ist bei einer Selbstklassifizierung immer noch um ein Vielfaches größer als bei beim Eintragen von Trivialbewertungen. Vielmehr wissen Leute, die Koordinaten ersetzen, tote Links ausbessern oder Bilder hochladen, oft sehr genau, für wieviele Punkte sie das tun. Außerdem kann man schlecht fehlende - genauso wenig wie falsche - Bewertungen/Klassifizierungen sanktionieren. Man kann nur bitten, dass die Leute mithelfen.
Im Übrigen fängt jetzt langsam wieder das Durcheinander an, weil die Bewertungen in einer anderen Reihenfolge abgearbeitet werden als die Eintragungen in der Teamtabelle. Das sollte so oder so anders werden, Redundanz ist immer Gift. Vielleicht gebe ich mir auch zu viel Mühe, das aktuell zu halten, aber selbst für die Schlusskontrolle - und die habe ich die letzten beiden Male gemacht - ist das zu unübersichtlich und zu aufwendig, das kann man sich wirklich einfacher machen. -- Harro 01:41, 5. Jun. 2012 (CEST)

Die Idee mit dem Fließbandsystem und auch deine Erläuterungen bezüglich des Chaos bei fehlender Abarbeitung in Reihenfolge kann ich nachvollziehen. Lösen lässt sich dies allerdings auch durch den A-Schiri, der, statt in der Wettbewerbstabelle die Buchstaben der Schiris zu schreiben, sofort die Tabellen erstellt und bei Signatur den Namen des zugeordneten Schiedsrichters schreibt. Die Eintabellenlösung führt dazu, deshalb sind die Einzeltabellen durchaus sinnvoll.

Das Selbstbewertungssystem kann mich hingegen beim besten Willen nicht überzeugen. Ich bin sehr dafür, die entstehende Komplizierung mit der gewonnen Zeitreduzierung zu vergleichen:

/ Mein Vorschlag Dein Vorschlag
Kosten Hinweis an die Teilnehmer: Ordnet eure Überarbeitungen in Klassen ein, die Verbesserungen beinhalten, für die ihr ähnlich viel Zeit investiert habt und die einen etwa vergleichbaren Mehrwert erbracht haben. Alles weitere an Komplizierung betrifft ausschließlich den A-Schiri. Teilnehmer müssen sich mit Vorlagensyntax auseinandersetzen und sich die Kriterien zu Marginalbearbeitungen durchlesen. Auch findet eine Dezentralisierung für die Teilnehmer statt, deren Edits sich zuvor allein auf die Wettbewerbstabelle beschränkt haben. Wir als Kern der Wettbewerbsgestalter sind betriebsblind hinsichtlich der Einschätzung des durchschnittlichen Teilnehmers: Die meisten haben null Ahnung von den Bewertungskriterien.
Nutzen Reduzierung des Bewertungsaufwands um 3/4. Ein Prozentsatz von ca. 1/4 sind (reine) Marginalbearbeitungen, die im Idealfall an weniger Aufwand anfallen würden für die Schiedsrichter. Dies bedeutet allerdings längst noch keine Aufwandsreduzierung für die Schiedsrichter um 1/4, denn dies sind nur die kleinen Verbesserungen, die ein Schiedsrichter innerhalb weniger Sekunden bewertet hat. Zudem ist der Wegfall von 1/4 der zu tätigenden Bewertungen auch nur der Idealfall, denn wo liegt der Anreiz für Teilnehmer ihre Verbesserungen selbst zu bewerten? Soll es dafür etwa Extrapunkte als Belohnung geben? Es ergibt sich höchstens eine überschaubare Zeitreduzierung von wenigen Prozenten.

--Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 12:41, 5. Jun. 2012 (CEST)

Trennen wir mal Eintragung und Selbstbewertung, Letzteres war ein Zusatzvorschlag. Also erstens: wenn wir den Leuten nicht zumuten können, eine vorgefertigte Standardtabellenzeile nach Schema F auszufüllen und einzutragen, dann sollten wir die Schreiber komplett außen vor lassen. Dann klappt das mit der Klasseneinteilung auf gar keinen Fall. Allerdings wäre ich skeptisch bei jemandem, der Artikel in einem Wettbewerb verbessern will, aber es nicht einmal hinbekommt, eine Tabellenzeile zu schreiben. Und selbst wenn es so jemanden geben sollte, so wird er das mit ein bisschen Hilfe auch hinkriegen. Und die Eintabellenlösung ist so schon besser, wenn Anmerkungen auch tatsächlich unter Anmerkungen eingetragen werden und man nur mit dem Namen und small abzeichnet (wie es mittlerweile Viele tun), dann wird es auch übersichtlicher. Aber das Hauptproblem, das den Mehraufwand verursacht, ist die doppelte Punkteführung.
Zweitens die "Marginalpunkte": alleine schon die Tatsache, dass von Koordinaten und Bildern überhaupt Gebrauch gemacht wird, zeigt, dass die Leute die Kriterien sehr wohl kennen, nicht alle, nicht im Detail, aber genug um mitzuhelfen. Warum sie es tun sollten? Warum machen Leute Schiedsrichter? Und als sichtbarer Anreiz: sie kriegen schneller ihre Punkte, die Bewertung geht schneller voran. Und wer nicht mithelfen kann oder will? Auch egal. Seine Punkte kriegt er trotzdem, bei den anderen ist es eine Vereinfachung. Und wenn nicht genug mitmachen? Auch egal, dann war es eben nicht mehr als ein gescheiterter Versuch.
Drittens die Klassifizierung: ich selbst kann als Schreiber, und schon überhaupt nicht als Neuling, den Mehrwert und nicht einmal den Zeitaufwand einschätzen. Ich kann gerade mal meine eigene Arbeit einschätzen, aber nicht bewerten. Ich könnte ein individuelles Klassensystem aufstellen, aber schon meine Teamkollegen arbeiten ganz anders und machen ganz andere Sachen. Je größer die Bearbeitungen, desto schwerer sind sie vergleichbar, desto mehr Klassen brauche ich, desto weniger Artikel pro Klasse habe ich und gerade bei den langwierigen Bewertungen spare ich kaum etwas. Allein der Praxistest: bei kaum einem Team sind mehrere große Artikel mit vergleichbarer Punktzahl dabei oder wären so eingeschätzt worden, und gerade diese Artikel sind die Punktebringer und Unterschiede machen viel aus. Und wenn ich mich bei einem Artikel sehr verschätze und ausgerechnet der wird dann zum Maßstab für die Klasse, dann verzerrt das das Gesamtergebnis. Dann kommen hinterher die Leute und wollen ihre Klassen wieder ändern. Das Alles macht es intransparent und schwer nachvollziehbar. Da setze ich mich als Schreiber lieber direkt mit den konkret fassbaren Punktwertungen auseinander, als ein eigenes Klassensystem aufzubauen, bei dem nach der Punktbewertung etwas ganz anderes herauskommt, als ich mir vielleicht vorgestellt habe, und ich mich frage, wie das bei den Mitbewerbern gelaufen ist. -- Harro 16:25, 5. Jun. 2012 (CEST)
Eintragung und Selbstbewertung habe ich in meiner obigen Argumentation bereits getrennt. Nur bin ich der Meinung, dass diese Eintragung besser vom A-Schiri gemacht werden sollte. Dann kann er sich die Buchstabensetzung in der Wettbewerbstabelle sparen. Und auch den Übertrag der Punkte für jeden einzelnen Artikel in der Wettbewerbstabelle kann man weglassen. Wer die Einzelbewertungen ansehen möchte, der klicke sich auf die Detailauswertung.
Dann klappt das mit der Klasseneinteilung auf gar keinen Fall. Mit Tabellensyntax und Parametern will manch Schreiberling nichts zu tun haben. Ich selbst bastle gern mit Vorlagen etc. herum, ich weiß aber, dass das viele nicht mögen. Für die Klasseneinteilung wird kein Vorlagensyntax benötigt. Einfach nach dem Schema Klasse x: [[Artikel]], [[Artikel]], ..... Damit wird vom Syntax her niemand überfordert.
Dass von Koordinaten und Bildern Gebrauch gemacht wird, ist nicht darauf zurückzuführen, dass die Kriterien durchgelesen werden, sondern die Richtlinien zur Artikelauswahl. Kaum ein Teilnehmer verläuft sich auf die Seite Hinweise für Schiedsrichter, geschweige denn liest diese durch.
Warum machen Leute Schiedsrichter? Natürlich, um mitzuhelfen. Ein objektiv fassbarer Grund liegt in dem Kompensationwochenende. sie kriegen schneller ihre Punkte, die Bewertung geht schneller voran wird als Anreiz nicht ausreichen, solange sie sich mit niemandem vergleichen können, bringen Punkte nix. Und für die meisten sind die Punkte sowieso absolut nachrangig. Nur eine Minderheit wird eine Selbstbewertung vornehmen. Ich finde auch den Gedanken falsch, möglichst alle Teilnehmer für den Bewertungsprozess rekrutieren zu wollen. Die meisten Teilnehmer wollen Artikel verbessern und sich nicht in Bewertungskriterien einlesen müssen.
Dann kommen hinterher die Leute und wollen ihre Klassen wieder ändern Klassen können bis zum Wettbewerbsende geändert werden, das kann absolut freizügig gehandhabt werden. Nur darf die Auswertungsseite nicht verlinkt werden, denn dies würde Schummelei ermöglichen (wobei ich niemandem unterstellen will, an solcher Manipulation interessiert zu sein). Die Transparenz und Nachvollziehbarkeit wird dennoch sichergestellt, indem die Detailauswertung nach Wettbewerbsende verlinkt, von jedem eingesehen und Nachfragen gestellt werden können. Bewertungsschluss ist immer erst einige Tage nach Wettbewerbsende.
Deinem Argument Je größer die Bearbeitungen, desto schwerer sind sie vergleichbar, desto mehr Klassen brauche ich, desto weniger Artikel pro Klasse habe ich und gerade bei den langwierigen Bewertungen spare ich kaum etwas stimme ich zu. In den höherwertigen Klassen wird es meist weniger Artikel geben, sodass dort wahrscheinich mehr als nur 1/4 der Artikel bewertet werden. Dafür reicht es aus, in Klassen von der Wertigkeit 1/2 Punkte nur jeden fünften Artikel zu bewerten. Dennoch korrigiere ich meine Einschätzung bezüglich der Zeitreduktion von 75 auf 60-70 Prozent.
Beide Vorschläge haben ihre Kosten (Verkomplizierung), in Bezug auf ihren Nutzen weichen sie aber stark voneinander ab. Im Grunde genommen hätte ich nichts dagegen, das Selbstbewertungssystem trotz meiner Vorbehalte (es gibt auch begründbare Vorbehalte gegen mein System: das will ich nicht abstreiten) umzusetzen. Aber: Wie in der obigen Tabelle dargestellt, rechtfertigt der in überschaubarem Maße erwartbare Nutzen in Form von Reduktion des Zeitaufwands nicht die entstehende Verkomplizierung. Das Diskussionsziel wäre, nimmt man das System als Fazit aus der Diskussion, nicht erreicht. Die Reduktion des Zeitaufwands wird minimal ausfallen. Eine deutlich spürbare Reduktion des Zeitaufwands ist gefragt, dazu bedarf es einer echten Reform. Verbesserungen haben wir schon in der Vergangenheit (Abschaffung der Doppelbewertungen, mehrere Schiedsichter, vernünftige Vorlagen) eingeführt - und meines Erachtens wäre der Wettbewerb ohne diese schon längst nicht mehr durchführbar. Weil die Teilnehmer- und Artikelzahl in der Tendenz immer weiter ansteigt, der Wettbewerb somit immer größer und deshalb auch schwieriger zu handhaben wird, muss aber noch ein großer Schritt unternommen werden, um den Bewertungsaufwand im Rahmen zu halten und somit die Zukunftsfähigkeit des Wettbewerbs zu sichern. Natürlich wird mein System dazu führen, dass die Bewertungen ungenauer werden. Ich möchte aber einerseits darum bitten, die Bewertungen nicht zu ernst zu nehmen (sie sind ein Spielanreiz, Spielanreize müssen nicht zu 100 Prozent fair und genau sein), zweitens die Einsicht fordern, dass die notwendige deutliche Reduktion des Zeitaufwands nur durch eine Abnahme von Genauigkeit geschaffen werden kann (das war schon bei der Abschaffung der Doppelbewertungen das Dilemma, eine ähnliche Situation haben wir nun). Unsere beiden Vorschläge befinden sich in unterschiedlichen Dimensionen: beide führen zu einer Komplizierung, sind aber dennoch realisierbar, deiner behält eine größere Genauigkeit bei, dennoch gewährleistet nur meiner eine deutliche Reduktion des Zeitaufwands. Und diese ist gefordert. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 19:22, 5. Jun. 2012 (CEST)
So langsam frage ich micht, ob du uns alle überhaupt noch verstehen magst: du kannst auf der einen Seite dich nicht als Schiri am laufenden Wettbewerb einbringen, erwartest aber von uns während der laufenden Bewertung eine Beteiligung an dieser im ausufernden und diffuser werdenden Diskussion, die mir mit deinem Satz: „Natürlich wird mein System dazu führen, dass die Bewertungen ungenauer werden“ immer abwegiger vorkommt. Deine Argumentation suggeriert eine Reduzierung des Zeitaufwands, bringt aber mit großer Sicherheit die Frustation aller Teilnehmer. Dann können wir direkt auch alles in kB wie im Wikicup messen. Kann es sein, dass du zu lange nicht mehr selbst als Bausteinabträger aktiv warst? Und verstehe diese Frage bitte nicht falsch, da alles andere auch immens viel Zeit benötigt. --Laibwächter (Diskussion) 21:55, 5. Jun. 2012 (CEST)
Laibwächter, mir mangelte es in den letzten Monaten leider an Zeit, um mich wirklich aktiv in der Wikipedia einbringen zu können. Dass ihr soviel zu tun habt, war eure Entscheidung. Ich habe bereits vor dem Wettbewerb eine zeitsparende Alternative erarbeitet: dafür, dass diese nicht umgesetzt wurde, bin ich nicht verantwortlich. Um dieses Gewirr nicht zu wiederholen, muss diese Diskussion geführt werden.
Natürlich wird mein System dazu führen, dass die Bewertungen ungenauer werden >> Was bitte ist daran abwegig. Wenn nur noch 1/4 der Verbesserungen bewertet werden, dann ist es nur logisch, dass es ungenauer wird. Wir können keine eindeutige Aufwandsreduktion mit gleichbleibender Genauigkeit erreichen. Das war auch schon bei der Abschaffung der Doppelbewertungen der Fall, wie ich in meiner obigen Argumentation ausreichend umfassend darlegte. Es gibt in seltenen Fällen Nutzen ohne Kosten: Um dies allen Diskutanten zu veranschaulichen, die Kosten-Nutzen-Analyse als vergleichende Darstellung der beiden Systeme in Tabellenform. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 22:11, 5. Jun. 2012 (CEST)
Und die Diskussion geht weiter. Ich habe eben zum drittenmal betont, dass es von deiner Seite unzeitgemäß ist, diese Diskussion loszutreten, während wir noch bei der Auswertung sind. Dieses eure Entscheidung besitzt dann doch eine gewisse Schadenfreude. Du hast uns nach einer eingeschlafenen Diskussion ein System vorgesetzt, das keiner verstanden hat und das niemand für sich annehmen wollte. Dabei hast du über die Köpfe aller anderen hinweggehandelt, keiner der sich als Schiedsrichter zur Verfügungen stellenden User hätte es umsetzen können, darüber hinaus hattest du bei der Einladung auch das bei den letzten Wettbewerben übliche Nachhaken "würdest du dich als Schiri zur Verfügung stellen" unter den Tisch fallen lassen und es bei der allgemeinen Diskussionsseite belassen. Außerdem hast du recht aktiv seit dem 5. Mai die von dir favorisierte Lösung vorangetrieben, wie man an den veränderten Vorlagen ersehen konnte. Vom Segeltörn zurückgekehrt, bin ich dann etwas aus den Wolken gefallen. Harro und ich favorisieren einhellig die Übergabe der Marginalbausteine an die User selbst. Dies hat unserer Einschätzung nach den Vorteil, dass diese sich auch einmal in die Schiriarbeit einfühlen können und wir ebenso rund 25% der Arbeit sparen könnten. Und eben nicht "natürlich" - eine derartige Wertung in einer Diskussion zu lesen, erstaunen mich selbst heute noch. EOD von meiner Seite bis zum Ende der laufenden Auswertung. --Laibwächter (Diskussion) 22:36, 5. Jun. 2012 (CEST)
Wenn ich mir anschaue, wann die letzten Male Auswertungsschluss war (kurz vor Beginn des nächsten Wettbewerbs werden die Auszeichnungen vergeben), bleibt ein sehr kleines Zeitfenster für solch wichtige Diskussionen. Das natürlich ist richtig, wenn etwas in der Natur der Sache liegt (wenn ich beim Segeltörn nur 1/4 aller Knoten prüfe, habe ich nicht die gleiche Sicherheit als wenn ich alle prüfe - bitte nicht 1 zu 1 auf den Wettbewerb beziehen: Beim Segeln geht es um Sicherheit, hier um ein Spiel!). --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 22:50, 5. Jun. 2012 (CEST)
Macht das Beiseiteschieben von Fakten eigentlich Schule? Die Plätze waren im März vergeben – für die Auszeichnungsbapperl fühlte sich jedoch keiner verantwortlich, dumm, wenn man keinen "a"-Schiedsrichter mehr hat - und alle anderen das fatalerweise ignorieren. Zeig mir übrigens das Spiel, bei dem nur 1/4 der Punkte gezählt werden. :P good night, not fight. --Laibwächter (Diskussion) 23:09, 5. Jun. 2012 (CEST)

Wiederaufnahme der Diskussion

Zunächst ein riesiges Lob an die Schiedsrichter. Das war diesmal wirklich eine Megaleistung. Dass die vollständige Auswertung trotz dieses großartigen Engagements erst nach einem Monat nach Wettbewerbsende abgeschlossen werden konnte, deutet jedoch wieder einmal auf die extreme Überlastung der Schiris hin.

Da es unser Anliegen ist, diese möglichst drastisch zu beschränken, müssen Maßnahmen her. Wir sollten uns darüber einig werden, was wir wollen. Wollen wir eine starke Reduzierung des Bewertungsaufwands, bedarf es einer starken Änderung des Bewertungsvorgangs - mit allen Risiken und Nebenwirkungen. Diese Risiken und Nebenwirkungen müssen wir meines Erachtens auf uns nehmen, um die langfristige Durchführbarkeit des Wettbewerbs zu sichern. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 09:17, 5. Jul. 2012 (CEST)

Bei früheren Wettbewerben hat es noch länger gedauert (bis zu 2 Monate) – und bei diesen waren allen Schiris permanent vor Ort inkl. a-Schiedsrichter. Wenn man sich selbst die Statements einiger WBW-Newbies und alten Hasen anschaut, dann ist die Bereitschaft groß, dass man bei den Mikrobewertungen (Koordinaten, Bilder etc.) die Bewertungen nach dem AGF-Prinzip selbst einträgt. Und gerade diese kosten - da wird mir jeder zustimmen - überproportional viel Zeit. Und laut Statistik - die Harro wieder dankenswerterweise aktualisiert hat - geht die Tendenz (durchschnittl. Punktemenge 10) gerade bei den beiden letzten Wettbewerben eher zu kleinen Bearbeitungen. --Laibwächter (Diskussion) 18:05, 5. Jul. 2012 (CEST)
Ich muss zwar sagen, dass sich die Auswertungszeit diesmal einigermaßen in Grenzen gehalten hat, aber gerade wegen dem Cup hätte es auch nicht länger dauern dürfen. Die Gefahr ist, dass wir das zu positiv werten, weil wir diesmal eine sehr gute Schiri-Mischung hatten und zwei zeitweilige Ausfälle kompensieren konnten. Im Winter war das nicht so und das war sehr kritisch. Wenn wir es mit einer kleinen Reform versuchen, dann sollten wir vielleicht in Betracht ziehen, einen Plan B in der Tasche zu haben, wenn wir nicht genug Schiris bekommen.
Zum Optimierungspotenzial des jetzigen Verfahrens: es waren über 100 Koordinaten, das kann man definitiv verbessern, indem die Mitmacher die in eine Extra-Zeile/-Tabelle eintragen und dann wird nur noch abgezählt. Als Problem sehe ich auch, dass gewisse Dinge einfach übersehen werden. Zweimal habe ich einen Upload übersehen, weil der nicht angemerkt war. Ich kann doch als Schiri nicht alle Bilder checken. Das muss der Teilnehmer angeben, dass er dafür Punkte will.
Das allergrößte Problem sehe ich aber in der Zuweisung, das klappt einfach nicht. Einige arbeiten schnell weg und lehnen sich dann zurück, obwohl sie weitermachen könnten, andere scheinen vor dem immer größer werdenden Berg demotiviert zu werden. Und man will nicht ständig drängeln oder fragen, wo man helfen könnte. Ich bleibe da bei meiner Idee des Fließbands, wo jeder Teilnehmer seinen Beitrag einträgt und die Schiris nehmen die dort weg und tragen das Ergebnis in die Teamwertung ein. Auch habe ich jetzt zweimal die Endkontrolle gemacht - die war nötig -, jedesmal musste ich umständlich verschieben, vergleichen, anpassen - das war völlig unnötig. Eine einzige Ergebnistabelle - und nicht lauter Minitabellen - wäre in jeder Hinsicht besser. Ich sehe im jetzigen Aufbau keinen Vorteil, nur unnötige Verkomplizierung. -- Harro 00:18, 6. Jul. 2012 (CEST)
Es gibt bestimmt auch Mikrobausteinbearbeitungen, bei denen wir erwägen könnten, diese für die Zukunft auszuschließen. Wenn ich sehe, dass einem ansonsten immer noch QS-würdigen Artikelchen gerade einmal als Notpflaster Kategorien verpasst werden, er aber ansonsten unbearbeitet bleibt, obwohl man mit nicht viel Mühe ihn einigermaßen anständig dastehen lassen könnte, sträuben sich mir die Haare bei der Bewertung. Das ist etwas anderes als wenn man die Koordinaten hinzufügt und dafür den Bilderwunsch unberücksichtigt lässt. Und Merl-Bot haut etliche Artikel nur wg. den Kats in die QS. Aber das wurde im laufenden Wettbwerb von einigen Usern aus welchen Gründen auch immer übersehen. Morgen mehr. Hier gewittert es mir zu häufig, sodass ich lieber den Compi ausschalte. Letztes Jahr hat mir meine Schutzsteckdose zwar den PC gerettet, aber man soll sein Glück ja nicht überanspruchen. LG --Laibwächter (Diskussion) 18:04, 7. Jul. 2012 (CEST)
Bei mir isses umgekehrt, das schöne Wetter treibt mich vom Computer wech, das muss man nutzen, bevor das nächste Gewitter kommt ;-)
Ich finde es zwar auch bedauerlich, dass einige Wenige da mehr aufs Punkteschinden als aufs tatsächliche Verbessern aus sind, aber da bin ich eigentlich eher großzügig. Es verbessert den Artikel und das zählt. Aber vielleicht kann man es durch Punktabzug weniger attraktiv machen. Was mich mehr stört, sind die vielen virtuellen Bausteine. Die verbessern zwar auch, teilweise erheblich, aber ich finde das unfair gegenüber denen, die sich den echten Beanstandungen durch Andere widmen. Besonders wenn vorher keine Bestätigung für den virtuellen Baustein eingeholt wurde, würde ich pauschal 50 % abziehen.
Wobei das alles jetzt nichts mit der Vereinfachung der Bewertung zu tun hat. Für Koordinaten und vielleicht noch für Bilder könnte man eine Schnellwertung einführen. Dass Kategorien die einzige Änderung waren, kam bei mir vielleicht ein- oder zweimal vor, das lohnt praktisch nicht. Mein Vorschlag war dann noch der Verzicht auf die doppelte Buchführung (Artikel + Wertung auf Haupt- und Detailseite). Irgendein größerer Wurf sollte es schon noch sein. Und den "Plan B" würde ich auch nicht unter den Tisch fallen lassen. Wenn der Schiedsrichterandrang so groß wird wie der Ansturm auf diese Diskussion, dann rettet uns die Kosmetik auch nicht. -- Harro 20:46, 7. Jul. 2012 (CEST)
Das mit dem Plan B sehe ich kritisch. Entweder muss man das schon vorher vernünftig geplant und in den Richtlinien umgesetzt haben oder man lässt es. Bewertungsmodelländerungen während des Wettbewerbs würden nur wieder zum Chaos führen. Ich biete mich an, das umzusetzen und könnte im August (wobei es auf die Daten ankommt, ich bin lange im Urlaub) mithelfen und koordinieren. Allerdings scheint auch die Zustimmung zu meinem zweiten Vorschlag nicht groß zu sein und ich habe keine Lust, wieder etwas auszuarbeiten, was dann nicht umgesetzt wird. Also entscheidet euch!! --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 10:48, 8. Jul. 2012 (CEST)
Die Bewertungskriterien und auch die Formalia müssen wir eindeutig vor dem Wettbwerb neu klären. Ich stimme Harro zu, dass gerade die Virtuellen Bausteine von manchem User etwas provokativ vorausgesetzt wurden, während andere vorher vorsichtig nachfragten. Das hat mitunter den Beigeschmack des bewussten Ignorierens, ggf. gar des "Artikel-auf-Halde-vorbereitens". Auch Ra'ike gefiel dies nicht. Also sollten wir festsetzen, dass "virtuelle Bausteine" in Zukunft nicht mehr gelten. Wer sich in den Portalen auskennt und engagiert, wird auch vor dem Wettbewerbsstart einen berechtigten Eintrag in eine wie auch immer geartete Wartungsliste zu Wege bringen. Das klappt z.B. bei den Biologen, den Mineralogen und den Literaten bereits seit Jahren. Warum also nicht in den anderen Bereichen, zumal gerade ein Portal eine Wartungsliste hat, die so lang ist wie der Nil?
Bei den Bilder- und Koordinatenwunsch-Bausteinen bzw. deren Abarbeitung ist die Bereitschaft der bisherigen Teilnehmer vorhanden diese selbst vorzunehmen. Auch dies könnte entsprechen eintragen.
Und wie sieht es mit der ebenfalls von Harro überlegten Wertungstabelle ohne separate Vorlagen aus? Das vielfältige Laden der klicki-bunti-Bausteine wird bei 120 kB Auswertungstabelle mitunter zum Bottlenecksyndrom, das Gripweed und mir mehrfach den Eintrag zur zeitraubenden Tortur werden ließen. Zur Entscheidung können wir erst kommen, wenn sich noch ein paar Mitstreiter zum Thema äußern. Und vor allen Dingen dürfen wir nicht den Fehler wiederholen, potentielle Schiedsrichter zu spät oder gar nicht anzusprechen. Emeritus hat z.B. erst kürzlich seine Bereitschaft geäußert und möchte dahingehend ein wenig unterstützt werden. --Laibwächter (Diskussion) 17:47, 8. Jul. 2012 (CEST)
Also was in Richtung "Selbstbewertung" geht, da bin ich einigermaßen skeptisch und würde das nicht so aus dem Hut zaubern wollen, ohne es wenigstens irgendwie mal anzutesten. Und die Bewertungen von ein paar Schiris objektiv hinzukriegen, ist schon schwer genug, bei subjektiver Selbstbewertung muss man viele Spielräume streichen, sonst fühlt sich dann der "Ehrliche" als der "Dumme". Wenn wir uns nicht auf einen gemeinsamen Plan B einigen können, nicht ausprobieren können und keiner so recht Zeit investieren will, bleibt nur zu hoffen, dass wir mit modifiziertem A durchkommen. Nikkis hat vor den Wettbewerben schon immer großartig getrommelt, probieren wir mal, ob da noch mehr Schiedsrichter herauszuholen sind.
Regeländerungen müssen festgeschrieben werden, über Wegfall oder Einschränkung virtueller Bausteine sollten wir nochmal abstimmen.
Für das "Fließband" werde ich mal einen konkreten Vorschlag ausarbeiten und die Ladezeit berücksichtigen.
Für Pauschalpunkte haben wir Koordinaten und Bilder. Evtl. noch Tote Links? Weitere Vorschläge und Details der Umsetzung wären hilfreich.
Und wenn jemand noch irgendwelche Vorschläge hätte, was bei der Bewertung viel Zeit und Aufwand kostet und was sich vereinfachen ließe, bitte dringend her damit. Gruß -- Harro 02:07, 9. Jul. 2012 (CEST)

Der olympische Gedanke

Mal eine ganz blöde Idee: wir lassen den regulären Sommerwettbewerb ausfallen :-O Statt dessen machen wir ein Olympia-Special: Der läuft dann vom Entzünden bis zum Löschen des olympischen Feuers und wird nach völlig neuen Regeln bewertet. Ich finde, die WP ist bei Großereignissen gar nicht gut aufgestellt, siehe die Fußball-EM. Da wir wohl nicht so viele Sportbegeisterte zusammenbringen werden, kann man trotzdem normale QS-Arbeit mitwerten (der "olympische Gedanke" zählt ;-), für Olympiabezogenes gibt es aber keine Bausteinpflicht und einen Punktebonus.
Der Vorteil wäre: wir brauchen a) nicht nach den alten Regeln schielen, weil der Wettbewerb außerhalb der normalen WBW-Konkurrenz läuft, und können b) dann hinterher entscheiden, ob wir einen WBW 2.0 weiterführen oder zur Version 1.0 zurückkehren. -- Harro 13:11, 5. Jul. 2012 (CEST)
Vom Prinzip her eine schöne Idee - nur muss ich allerdings subjektiv und im Interesse des Wikipedia:WikiCups dagegen sein, da die hiesigen Punkte im bestehenden Modus von diversen Teams und Einzelkämpfern schon fest eingeplant sind ;-) Da müssten wir uns mit Achim absprechen. --Laibwächter (Diskussion) 18:05, 5. Jul. 2012 (CEST)
Nun, ich denke, dass wir das auf jeden Fall irgendwie verwertbar hinbekämen. Es ändert sich ja nichts am Grundprinzip und die Bewertung steht so oder so zur Disposition, unabhängig von Olympia. Aber wenn wir von vorne herein schon wieder mit "dagegen" loslegen ... Wenn wir das mit dem Bewerten nicht rechtzeitig hinbekämen oder am Ende gar nichts stattfindet, dann hätte der Cup ein Problem. -- Harro 22:44, 5. Jul. 2012 (CEST)
Das hat dann aber nichts mehr mit einem Wartungsbausteinwettbewerb zu tun. Die Idee ist sicher nett, aber zieh doch damit einfach einen separaten Wettbewerb auf. --85.179.198.176 23:34, 8. Jul. 2012 (CEST)
Genau das sollte es ja sein. Die WP war auch schon mal offener für Neues. Aber gut, lassen wir es eben. -- Harro 01:37, 9. Jul. 2012 (CEST)
Also ich finde die Idee gar nicht mal so dumm, denn dann könnten wir tatsächlich neue Bewertungsregeln testen. Ich befürchte nämlich beim nächsten Mal mit gleichen regeln als Schiri nicht mehr zur Verfügung stehen zu können. --Gripweed (Diskussion) 16:38, 9. Jul. 2012 (CEST)
Generell bietet sich der Sommerwettbewerb gut für Testversuche an, weil die Beteiligung überschaulicher ist als in den anderen Jahreszeiten. So ganz verstehe ich aber nicht, warum es für Themen mit Olympiabezug einen Bonus geben soll, das macht es auch wieder ein klein wenig komplizierter und wenn wir schon lauter Regeländerungen einführen, dann sollten wir es nicht schon beim ersten Test durch Bonuspunktvergabe verkomplizieren. Ich bin also nicht dafür, wenn auch nicht vehement dagegen. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 17:43, 9. Jul. 2012 (CEST)
Außerdem fühlt sich nicht jeder dazu berufen Sportartikel zu bearbeiten. Früher wurde das Portal:Sport bei derartigen Wettbwerben dementsprechend aktiv, auch gab es einen Artikelmarathon, der einem sportlichen Großereignis gewidmet war. Wissen wir, ob sie das nicht doch etwas Vergleichbares in der Schublade haben? Könnte Marcus Cyron darüber informiert sein? --Laibwächter (Diskussion) 19:37, 9. Jul. 2012 (CEST)
Im Portal ist nichts angekündigt. Ich komme auch deshalb drauf, weil die Fußball-EM in der WP ein Reinfall war. Selten habe ich so viel außerhalb der WP gegoogelt. Das hat auch das Fußballportal total verschlafen. Ich denke da nicht egoistisch, Sportartikel sind auch nicht so Meines, außer Snooker, und das ist nicht olympisch. Aber wenn man sich Punkte und Auszeichnungen holen kann, indem man die Olympiaartikel aktualisiert und ausbaut, dann ist das das Beste, was der Wikipedia passieren kann. Alles andere ist Alltag und läuft uns nicht weg. Dass Sportverweigerer und WikiCupteilnehmer trotzdem mitmachen können, das lässt sich ja damit vereinbaren. Sie kriegen dann am Ende auch ihre Wertung, nur eben keine "olympische Medaille". Und mit dem Vorschlag von Jens lässt sich das besonders gut vereinbaren, bei den meisten Sportwettbewerben gibt es einen einzigen Wert und wer den größten hat ... -- Harro 00:46, 10. Jul. 2012 (CEST)
Sehe gerade in unserem Käseblättchen diese Wikipedia:Kurier#Vor Olympia-Meldung, der es mehr um Vollständigkeit des deutschen Kontingents, sprich neue Artikel und die Bebilderung geht. Also weniger um Artikelverbesserung. Was mich persönlich eher abschreckt, ist die Klicki-Bunti-Tabellen-Verliebtheit in diesem Bereich und dass es leider oft Artikelverschlimmbesserer anzieht wie die uneinsichtige Maus781 (Diskussion • Beiträge • hochgeladene Dateien • SBL-Log • Sperr-Logbuch • globale Beiträge • SUL • Logbuch)-Sockenpuppe. --Laibwächter (Diskussion) 08:56, 10. Jul. 2012 (CEST)

Maßnahmenkatalog

  1. virtuelle Wartungsbausteine werden konsequent mit der halben Punktzahl bewertet. Nachfragen auf der Diskussionsseite und nervige Regelabwägungen unterbleiben somit
  2. in der Wettbewerbstabelle werden die Punkte nicht mehr in Klammern hinter den Artikeln geführt. Somit fällt Übertragsarbeit weg
  3. Artikel werden nach Reihenfolge des Eintrags in der Wettbewerbstabelle auf der Auswertungsseite geführt, indem der A die Artikel und den Schiri direkt dort einträgt (falls man das vernünftig (optisch und praktisch) lösen kann, auch gern in eine Gesamttabelle). Übersichtlichkeit wird hiermit stark verbessert
  4. a) Selbstbewertung von Marginalbearbeitungen oder b) Klasseneinteilung

Während die Maßnahmen 1-3 wahrscheinlich relativ unumstritten sind, ist Maßnahme 4 noch auszudiskutieren. Ich plädiere nach wie vor für die größere und gewagtere Lösung der Klasseneinteilung und könnte deren Umsetzung beim nächsten Mal realisieren. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 16:10, 9. Jul. 2012 (CEST)

  • ad 1. Mit dem Abschreckungsfaktor kann man rechnen, wohl aber auch mit irgendeinen Schlauberger, der bereits mehrere vorbereitete Artikel auf Halde hat ;-) Aber wie ich schon sagte: es gibt Portal- und Projektwartungsseiten, auf denen es keine Mühe bereiten sollte, diese in ausreichendem Abstand zum WBW vorher einzutragen. Den Virtuellen Baustein kapiert im Wikicup kein Mensch.
  • ad 2. Das ist immer die geringste Arbeit gewesen (außerdem schauen die wenigsten Teilnehmer bisher regelmäßig auf die Auswertungsseite. Nur so kann ich mir das wiederholte Ignorieren der Anmerkungen und gelben bis roten Ampel erklären); viel schlimmer sind die langen Ladezeiten der Auswertungstabelle(n) über die Vorlage(n). Da auch alle Icons von Commons geladen werden, zieht sich dies unnötig in die Länge. IMHO könnte man auch eine vereinfachte Lösung wie bei Wikipedia:WikiCup/Beiträge bzw. Wikipedia:WikiCup nehmen, wobei wir inzwischen mehr Differenzierungen haben. Wie wäre es, wenn die Teilnehmer ihre fertiggestellten Artikel selbst in die Auswertungstabelle eintragen? Dann hätten wir nicht mehr das von Harro beklagte Durcheinander durch ein paar der Schiedsrichter.
  • ad 3. s. Punkt 2 Wer will dann noch den A-Schiedsrichter machen? Bei Wikipedia:WikiCup/Beiträge funktioniert es mit AGF bis dato. Dort wird zum Schluss von jedem die Überprüfung erbeten und von einem Statistikfesten User nachgeprüft.
  • ad 4. a) relativ klare Mehrheit bisher. b) die Klasseneinteilung kann außer dir niemand mehr nachvollziehen (Problem der Selbstkalkulation und des "Punkteverlusts") und damit würden Ra'ike, meine Person und noch ein paar andere Kollegen die Lust am Ganzen verlieren.
  • neu 5. Überarbeiten und Straffung unseres Wertungssystems. Da blicken die Newbies kaum mehr durch.
  • neu 6. FAQ-Sektion: die Fragen (z.B. "sollte ich meine hochgeladenen Bilder angeben" - JA, KLAR!) wiederholen sich. Irgendwann wird es langweilig.
  • neu 7. Kleines ABC für Teams: da hapert und stottert es (Crowd-Teams, Spaßteams, Karteileichen) z.T.
  • neu 8. Reine Layoutveränderungen werden nicht mehr gewertet. Alleine der Baustein ist ein Witz, wenn keine sichtbare Veränderung bewirkt wird.
  • neu 9. Deutlichere Anleitung gegenüber Neu-Schiedsrichtern vor dem Wettbewerb, siehe Emeritus
  • neu 10. Ersatzschiedsrichter vor dem Wettbewerb abklären. --Laibwächter (Diskussion) 19:33, 9. Jul. 2012 (CEST)

Vorschlag Byte-basiertes Bewertungsmodell

Ich hoffe ich darf ein von mir in der letzten Zeit ausgearbeitetes und getestetes Bewertungsmodell vorschlagen. Das Modell basiert auf Bytes, die Kompatibilität mit den bisherigen Wettbewerben (damit etwa gleiche Ergebnisse rauskommen) stellt der Umrechnungsfaktor (von mir auf 0,0053 ermittelt) sicher. Es soll deutlich einfacher und schneller funktionieren als das alte Bewertungsmodell.

Regelung

  1. Die Bewertung erfolgt durch zwei Kennziffern, die zu ermitteln sind und zum Endergebnis zusammengerechnet werden.
    1. Die erste Kennziffer ist der reine Zuwachs an Bytes durch die Überarbeitung. Sie berechnet sich folgendermaßen: ((Bytes nach Überarbeitung) – (Bytes vor Überarbeitung)) * (Umrechnungsfaktor 0,0053) = erste Kennziffer. Sie wird durch Betrachtung der Versionsgeschichte ermittelt.
    2. Nun kann ein Text auch überarbeitet werden, ohne dass es zu einer Zunahme der Artikelgröße kommt. Hierzu dient die zweite Kennziffer: Sie misst die Überarbeitung von bestehendem Fließtext. Sie berechnet sich aus der Anzahl der bearbeiteten Zeilen (abzulesen in der Diff-Ansicht, linke Spalte) sowie einem vom Auswerter festzulegenden Prozentsatz, der die Aufwändigkeit der Überarbeitung abschätzt. Eine Zeile besteht dabei aus ungefähr 10 Wörtern oder 100 Zeichen (ist entsprechend zu kallibrieren). Wurden die mangelhaften Zeilen komplett neu geschrieben, gibt es 100 %. Wurden nur durchschnittlich drei Wörter pro Zeile geändert, gibt es 30 %. Dieser Prozent-Wert bietet einen Ermessensspielraum des Auswerters. Beispiel: In der Diff-Ansicht werden 10 Zeilen mangelhaften Textes abgelesen, wobei schätzungsweise etwa 50 % der Wörter geändert wurden. Dann berechnet sich die zweite Kennziffer wie folgt: 10 * 50 * 0,0053 = 2,7 (zweite Kennziffer). Beide Kennziffern werden zur Endpunktzahl zusammenaddiert. In vielen Fällen ist die zweite Kennziffer gar nicht nötig, die wird nur gebraucht, wenn bestehender Fließtext überarbeitet wurde. Bei komplexen Artikeln kann die zweite Kennzahl auch zwei Mal berechnet und anschließend zusammengezählt werden, wenn für verschiedene Artikelteile mit zwei unterschiedlichen Prozent-Werten gerechnet werden soll.
  2. Neu hochgeladene Commons-Dateien bringen weiterhin einen Zusatzpunkt. Alle anderen Bewertungen (Einbindung der Bilder, Weblinks, Koordinaten, Literatur, etc.) sind in der Byte-basierten Auswertung mit drin. Natürlich wird es dann für eine doppelt so lange Literaturangabe doppelt so viele Punkte geben. Das bevorzugt vollständige Literaturangaben gegenüber Literaturangaben, die nur Autor und Titel enthalten.
  3. Die Seite "Detailauswertung" wird abgeschafft. Alle nötigen Angaben werden direkt in der Hauptliste in Klammern hinter dem Artikel eingetragen: 1) Abkürzung der QS-Liste, 2) Punkte 3) ggf. gelbe oder rote Ampel als Mängelanzeige, 4) Kürzel des Auswerters. Also könnte das wie folgt aussehen: Wernauer Baggerseen (Q, 5.1, J.).
  4. Jeder Auswerter weist sich Artikel selbst zu. So kann jeder so viel machen, wie er Zeit hat. Dies geschieht unter zwei Bedingungen: 1) Ein einzelner Auswerter wertet nicht mehr als 50 % der Artikel eines Teams aus. 2) Der Auswerter darf die Artikel nur der Reihe nach auswerten (damit nicht die Rosinen rausgepickt werden).

Spezialfall: Handhabung von Kürzungen

  1. Bei umfassenden Kürzungen – wenn mehr gekürzt wurde als neuer Text hinzugefügt (Beispiel Brigitte Bauma, Diff): Die erste Kennzahl entfällt und wird nicht berechnet. Jetzt werden im Diff alle neu formulierten Zeilen auf der rechten Seite gezählt (ich komme auf 15 Zeilen). Da es sich bei diesem Fließtext um die Ausformulierung der Liste handelt, würde ich 50 % vergeben. Also: 15 * 50 = 750. Jetzt gibt es noch 12 Zeilen mit kleineren Änderungen. Hierfür 20 %. Also: 12 * 20 = 240. 240 + 750 = 990. Dann ergibt 990 * 0,0053 = 5,2 Punkte.
  2. Bei kleineren Kürzungen – mehr neuer Text als Kürzungen: Sagen wir, 5 Zeilen wurden entfernt, gleichzeitig mit vielen Ergänzungen: Die erste und die zweite Kennzahl werden wie gehabt berechnet, die gelöschten Sätze nicht beachtend. Jetzt wird noch eine dritte Kennzahl berechnet und aufs Ergebnis hinzuaddiert, analog zur zweiten Kennzahl, um den durch die Kürzung verursachten Punktverlust auszugleichen. Also dritte Kennzahl: 5 Zeilen * 100 % * 0,0053 = 2,65 Punkte. Damit wurde der durch die Kürzung verursachte Verlust lediglich ausgeglichen. Will man die Kürzung honorieren, vergiebt man statt 100 % eben 110 % oder 120 %, je nachdem, wie aufwändig die Kürzung erscheint.

Beispiele (Artikel aus dem letzten WBW)

  • Hello, I Must Be Going! (Diff): 1786 Bytes hinzugefügt, 2,5 Zeilen gekürzt. Rechenschritte: 1) 2,5 * 100% = 250 (Ausgleich der Kürzung). 2) 250 + 1786 = 2036. 3) 2036 * 0,0053 = 10,8 (Ergebnis letzter WBW: 11,5)
  • Das Manuskript in der Flasche (Diff): 24.594 – 4.791 = 19.803 Bytes hinzugefügt. 1 Zeile gelöscht. Rechenschritte: 1) 19.803 + 100 = 19.903. 2) 19.903 * 0,0053 = 105,5 (Ergebnis letzter WBW: 114,5).
  • Encana Corporation (Diff): 3.307 Bytes hinzugefügt. 12 Zeilen überarbeitet, 80 %. Rechnung: 12 * 80 = 960. 960 + 3307 = 4267. 4267 * 0,0053 = 22,6 (Ergebnis letzter WBW: 11,0).

Diskussion

Weil die Klasseneinteilung offenbar abgelehnt wird, ich mich mit dem Selbstbewertungssystem aber überhaupt nicht anfreunden kann, ist dein Vorschlag mein vorläufiger Favorit. Schwierig wird die Prozentangabe sein und wie durchdacht das ganze ist, muss sich erst noch herausstellen. Jeder Teilnehmer sollte mit seiner Teilnahme die Selbstverpflichtung tätigen, keine Bytes, die keinen klaren Mehrwert bringen, zu tätigen. Danke aber auf jeden Fall für diesen Vorschlag! --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 22:35, 9. Jul. 2012 (CEST)
Auf jeden Fall ein Vorschlag, der ausprobierenswert ist. Es ist allerdings so eine menschliche Eigenheit, dass versucht wird, so etwas auszureizen. Beim WBW hatte ich den Fall, dass es eine Übersichtsseite mit allen Daten gab, trotzdem hat der Betreffende zu jeder Datenangabe eine Einzelseite verlinkt, um die Belegezahl hochzutreiben. Dem sollte man also irgendwie vorbauen.
Eine Frage bleibt noch: ich hatte einige Fälle, wo der Text erheblich gekürzt wurde. Das ist schon unter dem jetzigen System ein Problem, aber wie wird das mit der Aufwandsformel berechnet? Gruß -- Harro 00:57, 10. Jul. 2012 (CEST)
Ein interessanter Vorschlag nach dem "size matters"-Modell (großes Dankeschön an Jens für den Paradigmawechsel), den ich morgen anhand einiger Beispiele durchrechnen werde. Ein paar der langfristig-strittigen Fragen würden sich damit elegant erledigen, allerdings fiel mir beim letzten Wettbewerb auf, dass wir alle restriktiver bewertet haben und ein paar auch die Regeln ungewöhnlich interpretiert haben. Da fehlt etwas die Vergleichsbasis zu den vorangegangenen Wettbewerben.
Wie wendet man allerdings das Modell bei überarbeiteten Texten an, die wg. allgemeiner QS oder einem hochaktuellen Thema (schlimmer noch: Editwar) eine chaotische History haben? Die redundanten Belege hatte Harro ja bereits erwähnt.
Auch nicht unerheblich: Manche Vorlagenveränderungen und auch das jeweilige Tabellenlayout, sowie Klickibuntiverzierungen und Textbausteine (ich sage nur "Sportregularien") treiben ebenfalls das KB-Volumen locker in die Höhe. Das sind zumindest meine Eindrücke aus den bisherigen WBW-Wettbewerben und des Wikicups.
Die vereinzelt mäßige Qualität von Textüberarbeitungen (z.B. Ergebnisparaphrase, Grammatik, Stil) bleibt zunächst unberücksichtigt. Die Gefahr ist vorhanden, dass der auswertende Schiri dies übersieht.
Wie sieht das Ganze bei Textstreichungen oder Zusammenführungen aus? --Laibwächter (Diskussion) 08:03, 10. Jul. 2012 (CEST)

Danke für die Rückmeldungen! Ich habe den Vorschlag nochmal überarbeitet und mit Beispielen versehen. Zu den angesprochenen Punkten:

  • Wie Prozentzahlen wählen – Ein Beispiel: Diff. Die erste Kennziffer berechnet sich zu 2,4. Die zweite Kennziffer zähle ich 23 Zeilen, die verändert wurden. Ich schätze, dass im Durchschnitt zwei Wörter pro Zeile verändert wurden. Eine Zeile sind bei mir etwa 10 Wöter, also beträgt der Prozentsatz 20 %. Die zweite Kennzahl beträgt also 2,4 – insgesamt sind 4,8 Punkte zu vergeben. Zweites Beispiel: Diff. Das ist schwieriger – sind die orange markierten Zeilen komplett gelöscht und durch neuen Text ersetzt, oder wurden sie lediglich umformuliert und in den neuen Text integriert? Das lässt sich nicht feststellen, ohne den Artikel zu lesen. Ich hätte hier für die zweite Kennziffer vielleicht 80 % für 21 Zeilen vergeben. Alles in allem empfinde ich die Unsicherheit und Ungenauigkeit beim alten Bewertungssystem als größer.
  • Wie wird mit Kürzungen umgegangen – Das hatte ich vergessen. Steht jetzt oben im Abschnitt "Spezialfälle".
  • Musik-Boxen und andere Tabellen-Lastige Bearbeitungen werden überbewertet – Beispiel: TP-3: Reloaded Diff. Die Kennzahl 1 beträgt 46.1, Kennzahl 2 ist hier nicht zu vergeben. Im letzten Wartungsbausteinwettbewerb 35,25 Punkte vergeben. Damit ist der Artikel um 23 % überschätzt. Natürlich könnte man noch einen Mechanismus einbauen, der die Tabellenarbeit etwas weiter abwertet. Ich würde jedoch dafür plädieren, das einfach so hinzunehmen (der Einfachheit/Durchsichtigkeit willen), und den Boxbearbeitern eine mögliche leichte Überbewertung nicht neiden. Diese Art von Ungerechtigkeit besteht bei allen Artikeln, und ist zwischen Artikeln mit unterschiedlichem Schwierigkeitsgrad viel höher. Nimmt man einfache Lemmata, bekommt man 20 Punkte in einer Stunde, nimmt man schwierige, braucht man für die 20 Punkte auch schon mal vier Stunden, wenn umfangreichere Recherchen vorausgehen müssen. Das sind nunmal die Grenzen eines solchen Bewertungssystems. PS: Beim Artikel Roma Žakaitienė (Diff), wo eine Kategorie und eine Personendaten-Box hinzugefügt wurde, komme ich mit dem neuen System auf 1,2 Punkte, während die Wertung im letzten Wettbewerb 1,5 war.
  • Missbrauchgefahr durch das Einfügen überzähliger Bytes – Gegen Missbrauch ist jedes Bewertungssystem machtlos – hier soll der Auswerter halt Punktabzug und rote Ampeln vergeben, wenn er einen solchen erkennt. Ich glaube nicht, dass das Byte-basierte Bewertungssystem da anfälliger ist als andere. Das aktuelle System misst Inhalt nach Zeilen – baut man Geschwurbel ein, lässt sich dort genau so betrügen wie hier. Auch im alten System kann man durch Überbebilderung, redundante Weblinks und Referenzen und inhaltliche Redundanzen Punkte ergaunern. Vielleicht hat Nikkis recht und wir sollen die Teilnehmer darauf hinweisen, dass ein fairer Wettkampf vor allem durch WP:AGF sichergestellt ist.
  • Auswertung bei chaotischer Versionsgeschichte – Ich würde hier einfach den Diff von der Ursprungsversion zur letzten Version des Teilnehmers auswerten. Falls zwischendurch von fremden Benutzern zu viel eingefügt wurde, kann man ja die eingefügten Fremdbytes in der Versionsgeschichte zusammenzählen und von denen des Teilnehmers abziehen. Oder gibt es da noch ganz üble Fälle, die ich nicht im Kopf habe? Hast du ein Beispiel?
  • vereinzelt mäßige Qualität von Textbearbeitungen bleibt unberücksichtigt – Ja, wenn die Auswerter die Artikel nicht lesen (was vom Aufwand her unmöglich ist), besteht diese Gefahr. Aber ist dieses Problem beim alten System nicht genau so groß? Hier kann der abzuschätzende Prozentsatz runtergeregelt werden + Setzen von roten und gelben Ampeln. Gruß, --Jens Lallensack (Diskussion) 19:21, 10. Jul. 2012 (CEST)
    • Bereits beim Überfliegen fallen mir die üblichen Mängel auf. Ist erst einmal wie beim letzten Wettbewerb der Verdacht da, dass dort jemand extrem nachlässig mit der deutschen Sprache umgeht, findet man schnell weitere Beispiele. --Laibwächter (Diskussion) 11:42, 11. Jul. 2012 (CEST)
Also mal unabhängig davon, dass sich noch ein paar Fragezeichen stellen und Feinschliff noch gemacht werden muss, wäre ich sehr dafür, den Vorschlag auszuprobieren, weil er mir am konsensfähigsten erscheint. Jens, von mir aus kannst du Wikipedia:Wartungsbausteinwettbewerb/Hinweise für Schiedsrichter entsprechend umgestalten. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 09:52, 11. Jul. 2012 (CEST)
Ich stehe nach Durchsicht der obigen Beispiel dem Ganzen noch recht abwartend gegenüber, da ca. 10 Prozent Abweichung bei manchen Beispielen mir im Moment zu viel sind. Dies mag zum einen daran liegen, dass mit der "Size matters"-Formel einige Ergänzungen wie z.B. Einzelnachweise als reine Datenzeile gegenüber der rein inhaltlichen Ergänzung wieder abgewertet werden oder auch das Hochladen bzw. Einfügen von Bildern keinen besonderen Einfluss mehr auf die Wertung haben - von den Koordinaten ganz zu schweigen. Außerdem empfinde ich einige o.e. Fragen noch ungeklärt, um hier wieder allzu schnell grünes Licht zu geben. Denn über die Hintertür schmeissen wir damit rund 60 % aller bisherigen Regeln über den Haufen. --Laibwächter (Diskussion) 11:42, 11. Jul. 2012 (CEST)
Wir könnten noch einige weitere Tests durchführen und dabei auch die Zeitersparnis bewerten. Eine Differenz ist übrigens schon im jetzigen System normal, weil Fehler bei der Anwendung der Kriterien unterlaufen, nicht alles restlos gesehen werden kann und Ermessensspielräume vorhanden sind. Und dass es jetzt Differenzen gibt, ist ganz normal. Wie du schon richtig sagst, werfen wir einen Großteil unserer bisherigen Richtlinien über Bord. Dies scheint mir - entscheiden wir uns dafür, weiterhin alle Artikel begutachten zu wollen, also die Klasseneinteilung zu unterlassen - die einzige Möglichkeit, unser Ziel zu erreichen. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 14:19, 11. Jul. 2012 (CEST)
Leider ist das Modell noch überhaupt nicht fertig, ich stehe noch vor einer Reihe von Problemen. Vor allem ist es mir noch nicht einfach, eindeutig und schnell genug. Mir schwebt da eine Idee vor, die das Modell nochmal grundsätzlich verändern könnte. Den Gedanken muss ich aber erst noch zuende denken. Im aktuellen Zustand ist das Modell imho leider noch nicht soweit, dass es überhaupt ernsthaft getestet werden kann. --Jens Lallensack (Diskussion) 14:52, 11. Jul. 2012 (CEST)

Ich hab leider ein grundlegendes Problem, das Modell weiter zu verbessern. In den meisten Fällen funktioniert es gut und schnell. Wenn ausschließlich Bytes hinzugefügt wurden und nichts geändert/gelöscht wurde, lässt sich die Punktzahl sofort berechnen. Wenn hinzugefügt und geändert wurde, müssen zusätzlich noch die geänderten Zeilen gezählt werden und der Grad der Überarbeitung (Prozentzahl) abgeschätzt werden. Wird der Artikel jedoch umstrukturiert (Absätze werden verschoben), ist die Diff-Ansicht nicht mehr zu gebrauchen: Es erschenit alles nur noch rot, man sieht nicht mehr auf einem Blick, was überarbeitet, was gelöscht, was entlistet, was neu hinzugefügt wurde – hier kommt man um Lesen und Suchen nicht herum. Wenn die Bearbeitungen komplexer werden, addieren sich die nötigen Schritte für die Auswertung – hier ist der Aufwand es Auswerters einfach zu groß. In diesen komplexen Fällen ist dieses Modell nicht schneller als das alte. Ich fürchte dieses Modell ist eine Sackgasse – auch dieses Modell ist nicht die Lösung für alle Probleme. Mir gehen die Ideen aus, oder fällt euch noch was ein? --Jens Lallensack (Diskussion) 21:49, 11. Jul. 2012 (CEST)

Wie gehen eigentlich Plagiatsjäger vor?

Nochmal ein anderer Ansatz: Man nehme die Bytezahl des verbesserten Artikels und verrechnet diese mit der Ähnlichkeit zur mangelhaften Version. Deshalb die Frage: Wie gehen eigentlich Plagiatsjäger vor? Gibt es da ein Programm, das die Ähnlichkeit zweier Texte in Prozenten angibt? --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 22:13, 11. Jul. 2012 (CEST)

Levenshtein-Distanz - ich kann nicht beurteilen, ob uns das weiterhelfen kann. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 22:29, 11. Jul. 2012 (CEST)
Full ack. Die normale Diff-View reicht einfach nicht aus – eine bessere Software könnte alle unsere Probleme lösen. Ich bin über dieses Skript gestolpert: Benutzer:Jah/Hauptautoren. Das zeigt einem die fünf Hauptautoren eines Artikels an, und zwar nicht nach der Anzahl der Bearbeitungen, sondern tatsächlich nach Textinhalt. Mehr noch, es gibt an, wie viele Wörter in der aktuellen Version von jedem Benutzer stammen. Diesen Wert können wir direkt in unsere Punkte umrechnen, und zwar einfach, indem wir ihn durch 20 teilen. Beispiel: Die Gelbschnabelelster von TAM aus dem letzten WBW. TAM hat laut Skript 2967 der Wörter beigetragen, also: 2967 : 20 = 148 Punkte (WBW-Wert: 138,5). Das sieht sehr gut aus. Dieses Skript ist natürlich nicht unsere Lösung (es berücksichtigt kein Meta-Krams; man kann nicht zwei bestimmte Versionen vergleichen, sondern nur den ganzen Artikel). Es müsste doch aber technisch möglich sein, ein Tool zu programmieren, das auf dem Toolserver läuft, das an unsere Anforderungen angepasst ist und uns die Endpunktzahl ausspuckt, wenn wir es mit dem Artikelnamen, dem Benutzernamen des Teilnehmers und dem WBW-Zeitraum füttern. Wenn wir das hätten, würden sich alle Probleme lösen: Es wäre schnell, super einfach (die Teilnehmer könnten ihre Punkte sogar ohne weiteres selber auswerten) und transparent (keine menschlichen Fehler/Ungerechtigkeit mehr). Wir müssten nur jemanden finden, der bereit ist uns so etwas zu programmieren. Ich könnte mal Benutzer:Aka um eine technische Einschätzung bitten. --Jens Lallensack (Diskussion) 22:48, 11. Jul. 2012 (CEST)
oder http://www.seoranker.de/seo-tools/text-similarity/ - Durchbruch erreicht? --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 22:59, 11. Jul. 2012 (CEST)
Wunderbar, vielen Dank, genau das haben wir gebraucht. Ich habe damit mal die Gelbschnabelelster neu berechnet: Prozentualer Unterschied laut seoranker.de beträgt 88 %. Die auszuwertende Version des WBWs hat 28.953 Bytes. Rechnung: 28.953 * 0,88 * 0,0053 = 135 Punkte (WBW-Wertung: 138,5 Punkte). Ich teste das morgen noch weiter. Das könnte echt die Lösung sein … --Jens Lallensack (Diskussion) 23:26, 11. Jul. 2012 (CEST)

Bisher habe ich noch keine groben Unregelmäßigkeiten gefunden. Weitere Beispiele folgen und ich möchte alle auffordern, selbst Beispiele vorzurechnen!

Des Weiteren würde ich vorschlagen, Koordinaten weiterhin nach altem Maßstab zu beurteilen, weil in diesen Fällen das alte System das schnellere ist.

Mit folgender Vorlage ist die Auswertung eine Sekundensache: {{WBWB|Byte=10463|Ähnlichkeit=58.86}}

Außerdem habe ich noch den Parameter frei eingebaut, mit dem die maschinelle Bewertung in begründeten Fälle nach unten oder oben korrigiert werden kann. Zum Beispiel bei Kürzungen, denn die gehen plötzlich genauso stark wie Ergänzungen ein. Und auch die Bewertung von Tabellen kann durch diesen manuellen Parameter noch nach unten geschraubt werden. Wann eine solche manuelle Korrektur eingesetzt werdenkann/sollte, müssen wir noch ausfeilen.

In Hinblick auf die Tabellen ist mir noch eingefallen, dass man grundsätzlich nicht den Quelltext, sondern den Ansichtstext kopiert. Somit fällt natürlich der ganze Syntax weg, aber einen großen Unterschied bewirkt das durchschnittlich nicht. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 15:59, 12. Jul. 2012 (CEST)

Diese doch sehr abweichenden Resultate zaubern mir jetzt aber schon wieder ein Stirnrunzeln ins Gesicht. Wo ist der Haken? --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 16:22, 12. Jul. 2012 (CEST)

Der Haken liegt in der Wikipediasyntax, die bei jeder Verlinkungsmethode zum Teil recht unterschiedliche Dateigrößen produzieren kann. Mit einem einfachen Mustertext sollte man das einmal durchprobieren. Deswegen produziert das System derartige Abweichungen, die mir einfach zu groß sind. Nachsatz: Was soll diese merkwürdige Überschrift? --Laibwächter (Diskussion) 21:06, 12. Jul. 2012 (CEST)
nein, am Wikisyntax liegt es nicht. Ich habe es sowohl mit Quell- als auch mit Ansichtstext ausprobiert. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 21:24, 12. Jul. 2012 (CEST)


Noch einige Beispiele. Wir sollten noch sehr viel mehr Beispiele vorrechnen, um diese zu analysieren und im Zuge dessen heraus zu stellen, in welchen Fällen das System gut funktioniert und in welchen man manuell korrigieren müsste. Bei den eben hinzugefügten Beipielen fällt mir auf, dass allgemeine Verbesserungen relativ genau bewertet wurden. Wenn ausschließlich Belege hinzugefügt wurden, hat das System zu wenige Punkte gegeben. Insgesamt meine ich, dass wir der Lösung nah sind, aber es bedarf noch sehr viel mehr Beispiele. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 10:32, 13. Jul. 2012 (CEST)

Ich habe wage Ideen, wie wir die Formel anpassen können um das Problem mit den Kürzungen rauszurechnen. Eine Menge an Beispielartikel zum Testen ist dafür Voraussetzung. Mir ist aber überhaupt nicht klar, wie genau du vorgehst, um die Ähnlichkeiten zu bestimmen. Hast du sämtliche obige Beispiele nach genau demselben Verfahren gerechnet? Nimmst du den Quelltext oder den Artikeltext? Insbesondere ist mir noch völlig unklar, wie du bei Brigitte Bauma auf 95.10% Ähnlichkeit kommst. Könntest du deine Vorgehensweise nochmal genau dokumentieren? Danke, --Jens Lallensack (Diskussion) 13:24, 13. Jul. 2012 (CEST)
Die Unterschiede resultieren bei den Einzelnachweisen bereits aus der unterschiedlichen Punktedefinition: eine Bildschirmzeile Text ist noch lange kein Punkt, ein gerade einmal halb so langer Beleg wird jedoch dennoch einen Punkt ergeben. Die Excel-Formel hinkt überall dort, wo wir bei einer singulären Ergänzung einen Punkt (Koordinate, Beleg, zusätzliches Bild) oder gar mehr Punkte (hochgeladenes oder erstelltes Bild) gegeben haben. Wenn man einen Text mit relativ vielen Belegen oder Bilder verbessert hat, wird das nach der automatischen Berechnung kaum oder sogar negativ gegenüber der reinen Texterweiterung ins Gewicht fallen. Und dann wäre leider das Entfernen eines Beleg-Bausteins ad absurdum geführt. WP:Belege perdu. Und zur Ähnlichkeit: Wenn in einem zu überarbeitenden Text lediglich Zitate ohne Belege geführt werden und diese nach der Überarbeitung "lediglich" mit den Belegen abgesichert wurden, ist die Textähnlichkeit ohnehin sehr groß. Also, noch einmal, was soll diese merkwürdige Kapitelüberschrift? --Laibwächter (Diskussion) 17:23, 13. Jul. 2012 (CEST)
Diese kleineren Problemchen müssen wir dann halt mit entsprechenden Zusatzpunkten ausgleichen. Hier könnten wir sogar die Teilnehmer bitten, selbst anzugeben, wie viele Koordinaten, Commons-Bilder, eingebundene Bilder und zusätzliche Referenzen verwendet wurden. Ich bin zuversichtlich, dass sich das alles lösen lässt. Was mir mehr Sorgen bereitet, ist der Umgang mit Kürzungen. Um das auszugleichen, will ich mal 20 Artikel durchrechnen um ein verlässliches Bild zu bekommen, welche Rechnung am genauesten ist (am besten mit bisherigen WBW-Wertungen übereinstimmt). Zur Überschrift; na, die ist wichtig, diese rethorische Frage hat schließlich zu dieser Idee geführt. --Jens Lallensack (Diskussion) 17:58, 13. Jul. 2012 (CEST)
Hast du sämtliche obige Beispiele nach genau demselben Verfahren gerechnet? Ja. 1) mangelhafte Version heraussuchen, Quelltext kopieren, im Tool einfügen, 2) das gleiche mit der verbesserten Version, 3) Vergleichen
Die Excel-Formel hinkt überall dort, wo wir bei einer singulären Ergänzung einen Punkt (Koordinate, Beleg, zusätzliches Bild) oder gar mehr Punkte (hochgeladenes oder erstelltes Bild) gegeben haben - Ja, stimmt absolut. Lösen lässt sich das durch Zusatzpunkte. Dabei sollten die Teilnehmer die Anzahl der Belege, Koordinaten uä. selbst angeben. Für einen Beleg könnte man einen halben Zusatzpunkt veranschlagen. Hierdurch wird das ganze wieder etwas komplizierter, insgesamt wäre dieses System, falls es denn wirklich funktioniert, eine so große Zeitersparnis, dass dies zu verkraften wäre. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 19:33, 13. Jul. 2012 (CEST)
Alles klar, ich wollte nur vermeiden, dass wir aneinander vorbei rechnen. Dann hast du bei Brigitte Bauma wahrscheinlich irgendwelche Zahlen vertauscht? Habs mal nachgerechnet und korrigiert. Bezüglich Vereinfachung des ganzen: Deine Vorlagen bringen mich auf eine Idee. Wir legen die Seite "Detailauswertung" auf Eis, und verwenden die Vorlagen für jeden Artikel direkt in der Artikelliste. Dann brauchen die Auswerter die Angaben der Teilnehmer nur noch in die Vorlage übertragen, und zusätzlich die Ähnlichkeit und die Byte-Größe bestimmen und ebenfalls in die Vorlage hauen. Die Vorlage sollte dann weitere Parameter für die Zusatzpunkte, das Kürzel des Auswerters, und optional die gelbe oder rote Ampel mitbringen. Die ganzen für die Rechnung benötigten Zahlen kann man ausblenden und nur das Ergebnis anzeigen, um das ganze nicht zu überfrachten – im Quelltext wären sie aber immernoch einsehbar. --Jens Lallensack (Diskussion) 23:22, 13. Jul. 2012 (CEST)

Ich glaube, das größte Problem dieses Modells ist, dass die "Ähnlichkeit" zwischen Kürzung und Hinzufügen von Bytes nicht unterscheidet. Dem Artikeltext kann bei der Wartung drei Dinge widerfahren: Er kann gekürzt werden, er kann verändert werden und er kann erweitert werden. Kürzungen und Erweiterungen werden gleich behandelt, das heißt, füge ich vier Zeilen hinzu, sinkt die "Ähnlichkeit" im gleichen Maße als wenn ich vier Zeilen entferne. Nehmen wir an, die Veränderung beträgt 100 % (sprich, der Text wird durch einen anderen, ebensolangen Text ersetzt): Dann wird diese Veränderung doppelt so hoch bewertet wie das reine Hinzufügen oder Entfernen eines ebensolangen Textes (da sich der alte gelöschte Text mit dem neu hinzugefügten addiert). Diese Diskrepanzen werden abgeschwächt, da die "Ähnlichkeit" ja mit der Bytezahl, die mit der Wartung erreicht wurde, multipliziert wird. Ist die Bytezahl also mit der Wartung gestiegen, kommen am Ende mehr Punkte heraus, als wenn die Bytezahl gesunken wäre. Dennoch ist die Diskrepanz groß genug, um bei gekürzten Artikeln zu deutlichen Fehlbewertungen zu führen (Beispiel: Brigitte Bauma, WBW-Wertung 1,5 Punkte, neue Wertung 11 Punkte). Ich habe versucht die Diskrepanz herauszurechnen (Grundidee: Die "Ähnlichkeit" mithilfe der Bytedifferenz korrigieren). Damit kann man zwar Kürzungen vollständig rausrechnen (0 Punkte); an anderen Stellen hat das aber negative Effekte. Vielleicht mag das mal jemand mit größeren Mathekenntnissen als ich sie habe nochmal probieren, vorerst vermute ich, dass auch dieses Text-Ähnlichkeits-Tool für unsere Zwecke nicht ausreicht. --Jens Lallensack (Diskussion) 17:16, 14. Jul. 2012 (CEST)

Das mit den reinen (!) Kürzungen habe ich auch erkannt, das müsste man halt irgendwie sonderwerten. In meinen Augen ist dies nicht das größte Problem. Sehr komisch sind die Ergebnisse bei Sozialistische Partei Albaniens und Banka e Shqipërisë. Hier kann ich vor allem auf die Schnelle gar nicht erkennen, was zu der großen Differenz führt. Vielleicht liegt es daran, dass sowohl ergänzt, verändert als auch gekürzt wurde. In diesen Fällen liegt das Tool jedenfalls erheblich daneben. Als unbrauchbar möchte ich es dennoch noch nicht abstempeln. Die "Ähnlichkeit" mithilfe der Bytedifferenz korrigieren - ja, eine weitere Möglichkeit. Ich werde das mal morgen untersuchen, ob somit eine bessere Genauigkeit erreicht werden kann. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 19:41, 14. Jul. 2012 (CEST) PS: Irgendwie müssen wir diese Automatisierung hinbekommen, das wäre wirklich die Lösung, um den Aufwand drastisch zu senken!!
Ich glaube, das Problem beschränkt sich nicht nur auf absolute Kürzungen (=Byte-Zahl nimmt durch Wartung ab). Wie gesagt, ersetzt man Text durch einen anderen, wird dies von der "Ähnlichkeit" doppelt so hoch bewertet, als wenn man die gleiche Menge Text einfach nur hinzufügt. Wenn der Teilnehmer sich also auf Hinzufügen neuen Textes beschränkt, wird das deutlich schlechter bewertet, als wenn er gleichzeitig zu seinen Ergänzungen bestehenden Text löscht. Baut er einen Zwei-Zeilen-Artikel aus, wird das schlechter bewertet, als wenn er einen größeren, aber grottig schlechten Artikel komplett neu schreibt (bei gleicher Textmenge im fertigen Artikel). Das kann zu keinem fairen Ergebnis führen. Ich finde auch, dass Automatisierung der richtige Weg ist, bin aber gerade ratlos wie das mit diesem Tool zu realisieren ist. Aber vielleicht fällt dir ja was ein. --Jens Lallensack (Diskussion) 20:04, 14. Jul. 2012 (CEST)


Streifenschakal (|26.51|{{{sr}}}) (24)
Faith (Album) (|29.67|{{{sr}}}) (25)
Wörterbuch (Roman) (|10.73|{{{sr}}}) (12)
Dino Reisner (|2.76|{{{sr}}}) (5,25: negative Differenz)
Brigitte Bauma (|5.56|{{{sr}}}) (1.5: negative Differenz)
Jakup Mato (|3.47|{{{sr}}}) (4,5: negative Differenz)
Sozialistische Partei Albaniens (|38.76|{{{sr}}}) (27)
Banka e Shqipërisë (|26.19|{{{sr}}}) (20)
Pogradec (|0.56|{{{sr}}}) (1: negative Differenz)
Tourismus in Albanien (|17.22|{{{sr}}}) (12.5)
Fredegond Shove (|53.37|{{{sr}}}) (61,5)
Der Fänger im Roggen (|6.4|{{{sr}}}) (7)
Anatoli Kornelijewitsch Winogradow (|2.53|{{{sr}}}) (3)
Ester Ringnér-Lundgren (|65.29|{{{sr}}}) (71,5)
Charlotta Falkman (|16.13|{{{sr}}}) (14)
Aufstand der Tiere (|17.25|{{{sr}}}) (20,5)
Peggy Sue hat geheiratet (|111.9|{{{sr}}}) (127)
Unbehagen (Album) (|47.22|{{{sr}}}) (50)

  • pro Beleg: 0.5 Extrapunkte
  • bei Kürzungen: nodiff=x

Das ist jetzt sozusagen das Mittelding zwischen den beiden Möglichkeiten, also eine Kombination zwischen Bytedifferenz und Ähnlichkeit verrechnet mit der Gesamtgröße. Rechenweg siehe Wikipedia:Wartungsbausteinwettbewerb/Vorlage Rechnung. Bei Kürzungen ergeben sich weiterhin nennenswerte Abweichungen. Allerdings muss man hier auch sehen, dass Kürzungen niemals einheitlich bewertet wurden, es also im alten System nicht besser gelöst war. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 12:03, 15. Jul. 2012 (CEST)

Sieht auf dem ersten Blick wirklich gut aus. Was noch nötig ist, ist eine Vereinfachung der Vorlage. Ich würde die Vorlage so umgestalten, dass nicht die Differenz, sondern "Bytezahl vor Überarbeitung" eingegeben werden muss. Für die Differenz muss man oft nämlich erstmal den Taschenrechner bemühen, die Bytezahlen kann man einfach ablesen. Die Vorlage soll die Differenz am besten selbst berechnen. Außerdem würde ich für Belege, Commons-Bilder und Koordinaten jeweils extra Parameter definieren. Es ist sehr wichtig, das so einfach wie möglich zu machen.
Frage: Wie genau bestimmst du den Parameter "Frei", und was fließt da mit ein? Alleine die Belege können es nicht sein, das wären z. B. bei Anatoli Kornelijewitsch Winogradow 1 Punkt, nicht 1,25. --Jens Lallensack (Diskussion) 13:18, 15. Jul. 2012 (CEST)
Die Vorlage soll die Differenz am besten selbst berechnen. erledigt
Außerdem würde ich für Belege, Commons-Bilder und Koordinaten jeweils extra Parameter definieren. Dafür ist der Parameter frei bestimmt. Pro Beleg gibt man dort 0.5 Zusatzpunkte ein, pro hochgeladene Datei siehe Kriterien (sowohl Belege als auch Dateihochladungen sollten die Teilnehmer beim Ergänzen in der Wettbewerbstabelle selbst angeben). Wenn die Verbesserung aus dem Hinzufügen einer Koordinate besteht, würde ich sagen, man lässt die Byterechnung weg, sondern bewertet nach dem alten Kriterium für Koordinaten. Das geht schneller. Auch kann man, wenn die Verbesserung aus einer Quellenangabe besteht, einfach einen Punkt vergeben. Die Bytemethode ist bei solchen kleinen Verbesserung eine Verkomplizierung, deshalb kann hier das alte System angewandt werden. Das macht keinen großen Unterschied, siehe Die Wespen (|3.42|{{{sr}}}) (3)
Bei Anatoli... habe ich mich verguckt.
Ein weiteres Tool ist http://www.seomastering.com/similar-text-checker.php. Das spuckt andere Zahlen aus. Kann man ja auch nochmal mit herumexperimentieren. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 13:45, 15. Jul. 2012 (CEST)
Hmm, ich sehe weiterhin eine Reihe von Vorteilen, wenn wir – wie auch in der alten Vorlage – die Wertungen für Belege, hochgeladene Dateien, Koordinaten und freie Zusatzpunkte in verschiedene Parameter aufteilen. Vorteile sind zum einen, dass es noch einfacher und damit fehlerfreier würde, und zum anderen, dass es transparenter würde. Einfacher würde es, da man in den Parameter nur noch die Anzahl der zusätzlichen Belege einfügen müsste; die Vorlage kann das automatisch durch 2 teilen (der Auswerter muss sich nicht mehr merken "pro Beleg – 0,5 Punkte"). Schließlich brauchen wir keine "Unterbelege" mehr mit der halben Punktzahl bewerten, dies übernimmt ja jetzt die "Ähnlichkeit". Mit den Parametern Dateien und Koordinaten genau so – wieso den Auswerter unnötig mit Punkten behellen, wenn er einfach die Anzahl der entsprechenden Objekte angeben könnte? Ich bin der Meinung: So einfach wie möglich, schließlich wollen wir auch mal neue Auswerter gewinnen, die sich hier natürlich erstmal komplett neu einarbeiten müssen. Transparenter würde das ganze werden, weil man im Zweifelsfall checken kann, wie das Ergebnis genau zu stande kommt. Und zu den Koordinaten: Wenn das die einzige Änderung ist, braucht man die Vorlage natürlich nicht, aber wenn das Hinzufügen einer Koordinate zusammen mit weiteren Änderungen auftritt, muss die Vorlage diesen Zusatzpunkt mit aufnehmen. --Jens Lallensack (Diskussion) 20:05, 15. Jul. 2012 (CEST)
Ich bin auch der Meinung, dass wir das alles so einfach wie möglich gestalten sollten, bin aber bei dieser Detailfrage anderer Auffassung als du. Bei Belege würde das hinkommen, weil es pro unterschiedlichem (!) Beleg konstant 0,5 Zusatzpunkte sind. Die Punktevergabe für hochgeladene Bilder und Koordinaten sind hingegen gestaffelt, das lässt sich per Vorlage nicht verwirklichen. Außerdem würden die zusätzlichen Parameter für noch mehr Syntax sorgen, sodass die Wettbewerbstabelle überladen wäre. Zur Transparenz: Die für die Zusatzpunkte nötigen Informationen sollen sofort bei der Ergänzung des Artikels von den Teilnehmern vermerkt werden, dann fällt auch wieder Arbeit für die Schiris weg. Und dass die Teilnehmer diese Zusatzinformationen angeben, liegt ja in ihrem eigenen Interesse, weil es dann mehr Punkte gibt (das wird per Editintro erklärt werden). Also kommt in den Parameter frei im Regelfall nur das rein, was der Teilnehmer zuvor angegeben hat. Falls die Bewertung von der Angabe des Teilnehmers abweicht, empfiehlt sich eine kurze Begründung auf der Diskussionsseite, worauf im Parameter anm hingewiesen wird (ist die Anmerkung sehr kurz, kann sie auch direkt in den Parameter geschrieben werden).
Bevor wir uns ernsthaft um solche Detail kümmern, wäre es besser, erstmal zu klären, ob wir das System jetzt tatsächlich einführen wollen. Hierzu schlage ich vor, noch einige weitere Beispiele vorzurechnen. Sollten dabei keine größeren Schwierigkeiten bemerkt werden, kann man die neue Methode im kommenden Wettbewerb testen. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 10:27, 16. Jul. 2012 (CEST)

Natürlich sind Abweichungen vorhanden, aber es sieht weiterhin ziemlich gut aus. Diese Abweichungen sind auch nicht unbedingt Fehler dieses Systems, auch mit dem alten konnten wir nie perfekte Bewertungen erzielen, zumal der Spielraum für menschliches Versagen nun sehr minimal ist. Weil ich ab nächster Woche drei Wochen im Urlaub ohne Internet bin, werde ich schon jetzt die Anleitungen entsprechend umgestalten. Falls ich das nicht mehr schaffe, bitte ich euch, das einzuarbeiten. Vielleicht findet sich auch noch die ein oder andere Verfeinerungsmöglichkeit in den nächsten Wochen, da kann ich dann leider nicht mehr mithelfen. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 10:54, 16. Jul. 2012 (CEST)

Alles klar, an die Staffelung habe ich nicht gedacht, dann ist es so besser. Ich bin auch dafür, dieses System einzuführen. Ich denke aber trotzdem, wir sollten erstmal den Vorschlag nochmal zusammenfassend hier auf der Disk-Seite vorstellen, mit allen Änderungen und Konsequenzen, und zur Abstimmung stellen, bevor irgendetwas geändert wird. Nochwas: Hast du mal überprüft, ob im Mittel etwa dasselbe rauskommt? Also ob das neue System nicht systematisch etwas über- oder unterbewertet im Vergleich zum alten System? Das wäre ja wichtig um die Vergleichbarkeit zwischen den Wettbewerben zu gewährleisten. --Jens Lallensack (Diskussion) 12:59, 16. Jul. 2012 (CEST)
Das im August ist erst mal nur ein Testlauf. Ich denke, man sollte nicht darüber abstimmen, bevor man es nicht in der Praxis getestet hat. Solange in einer öffentlichen Diskussion die Befürworter erkennbar in der Mehrheit sind, brauchen wir meines Erachtens keine Abstimmung, dann ist eine Abstimmung nur bürokratischer Aufwand ohne Mehrwert. Eine Abstimmung wäre mit einer Beteiligung mit drei bis vier Personen auch nicht wirklich sinnvoll. Wenn ihr Lust und Zeit habt, könnt ihr trotzdem eine durchführen, dann müssen aber auch Einladungen geschrieben werden, was ich wiederum etwas komisch finde. Wer sich für die Gestaltung des Bewertungssystems interessiert und mitreden möchte, der sollte sich hier eigentlich unaufgefordert einfinden.
  • Gesamtpunkte altes System: 587.75 (25,16 pro Artikel)
  • Gesamtpunkte neues System: 569,1 (24,7 pro Artikel)
--Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 16:32, 16. Jul. 2012 (CEST)
Also ich habe mir das nochmal überlegt und denke mir nun, dass es vielleicht doch gut wäre, aus Gründen der besseren Legitimation eine kurze Abstimmung durchzuführen. Ich werde das Modell trotzdem schon jetzt einarbeiten, weil ich das wegen Urlaubs sonst zeitlich nicht mehr schaffe. Dann kann man auch in der Erklärung bei der Abstimmung auf die Anleitungen hinweisen. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 16:45, 16. Jul. 2012 (CEST)

Fazit

Also ich finde es klasse, wie ihr beide das ausbaldowert. Leider fehlt mir Zeit und Muse, richtig mitzumischen, aber meine Unterstützung habt ihr. Wie auch immer, es muss alles erst einmal ausprobiert werden, um es endgültig zu beurteilen. Und wenn es schneller gehen soll, dann muss man bereit sein, Abstriche zu machen. Aber ihr scheint ein Ergebnis gefunden zu haben, dass sehr gut im Rahmen bleibt. Gruß und danke für euren Einsatz. -- Harro 20:52, 16. Jul. 2012 (CEST)
Zum einen ein Lob für Jens andersartigen Neuansatz und das Ausprobieren – zum anderen empfinde ich es schade, wie hier dank einer evtl. heilsbringenden Auswertungswollmilchsau einer längst überfälligen inhaltlichen Diskussion der Bewertungskriterien (was macht Sinn, was kann man wegfallen lassen, was möchte man dazunehmen) aus dem Weg gegangen wurde. Das wurde eigentlich von Harro und mir gemeint, aber leider wurde darauf in keiner Weise reagiert, wie auch ein Echo von den anderen altgedienten Mitgliedern der Bausteincommunity wünschenswert wäre. Anstatt einer selektiven Eigenbewertung bei den Mikroüberarbeitungen, die von der Community unterstützt und akzeptiert würde bzw. wurde, soll jetzt ein über eine Excel-Tabelle automatisiertes Verfahren treten, das inhaltliche Qualität (ähnliches kann man beim Artikelmarathon ohnehin und in den ersten Runden des Wikicups beobachten) noch schneller aus den Augen verliert und zum großen Teil eine Abweichung von 10 % bringt. Aufgrund dieser großen Abweichung (übrigens in beiden Richtungen) bin ich leider skeptisch. Könnte Jens zumindest einmal James Elroy Flecker aufgrund der vielen ENW durch sein modifiziertes Modell jagen – Und im Gegenvergleich eine der großen Bischofs-Listen aus dem Herbst 2011-Wettbewerb? Auch Ra'ikes, TAMs oder Zackes Meinung würde mich interessieren. --Laibwächter (Diskussion) 16:22, 18. Jul. 2012 (CEST)
@Laibwächter – nur eine kurze Antwort, hab leider überhaupt keine Zeit und bin nächste Woche gar nicht da. 1) Die aktuelle Variante (siehe bei den inzwischen umgebauten "Hinweisen für Schiedsrichter") wurde maßgeblich von Nikkis entwickelt, ich habe lediglich geholfen und mit kritischen Kommentaren genervt. Diese Variante hat mit meinem ursprünglichen Vorschlag nicht mehr viel zu tun, außer, dass auch hier Byte-Zahlen abgelesen werden müssen. 2) Das neue System ist wesentlich genauer, wenn es darum geht, zu messen, wie stark ein Text verändert wurde, wie viel neu hinzugefügt und wie viel gelöscht wurde. 3) Eine Excel-Tabelle existiert nicht, das macht eine Vorlage. 4) Welche Bewertungen würdest Du weglassen wollen? 5) Zu den Abweichungen: Die rühren zum Teil auch daher, weil dieses System die Änderung der Textmasse deutlich genauer misst. Ein grundsätzlich neues Bewertungsverfahren, das kaum Abweichungen vom alten hat, ist nicht möglich; wir müssten dazu theoretisch die Ungenauigkeiten und Fehler des alten Systems mit ins neue übernehmen. 6) James Elroy Flecker ergiebt (q|215|J), also 215 Punkte (im WBW: 234 Punkte). Gruß, --Jens Lallensack (Diskussion) 18:24, 18. Jul. 2012 (CEST)

Laibwächter, danke für dein Lob, aber auch und insbesondere für deine kritischen Anmerkungen.

  • Das neue Modell ist ein ganz neuer Ansatz, bei dem es keiner ausgeklügelten Bewertungskriterien mehr bedarf. Dies ist neben der erheblichen Beschleunigung der Bewertungen in meinen Augen ein zentraler Vorteil. Einerseits wird es für die Schiedsrichter einfacher, weil sie sich nicht mehr in umfangreiche Punktevergabekriterien einlesen müssen, andererseits ist das auch für die Teilnehmer verständlicher, weil eine Rechenformel simpler, einprägender und universaler ist als eine Menge Kriterien in Textform von 40.000 Bytes.
  • Diese Universalität ist hingegen wiederum ein Problem, denn das neue Modell behandelt alles gleich: egal, ob klassischer Inhalt, Listen oder Tabellen. Hierbei ist jedoch darauf hinzuweisen, dass wir im alten Modell mit diesen Bewertungen auch immer Schwierigkeiten und Diskussionen hatten, die Bewertung von Tabellen und Listen nie perfekt ausgeklügelt war. Im Prinzip haben wir nun die gleiche Situation, denn eine sehr wichtige Regelung des alten Systems besagte: Ihre Ermessensspielräume können Schiedsrichter immer dann ausnutzen, wenn sie den Eindruck haben, dass der Aufwand und der erarbeitete Mehrwert der vorgabetreuen Bepunktung nicht gerecht wird. Auch in Hinblick auf die Qualität kann der schiedsrichterliche Ermessensspielraum angewandt werden. [...] Wenn Ermessenspielräume ausgenutzt werden, ist ggf. eine Doppelbewertung sinnvoll. Diese Regelung ist genau so bestehen geblieben.
  • Zur selektiven Eigenbewertung bei den Mikroüberarbeitungen: Dieser Vorschlag wurde übernommen! Falls im Rahmen der Verbesserung neue Belege hinzugefügt, Dateien hochgeladen, Koordinaten ergänzt oder einige andere Verbesserungen (werden im Folgendem genannt) getätigt wurden, weisen die Teilnehmer in der Wettbewerbstabelle hinter dem Artikellink darauf hin, denn diese Verbesserungen bringen Bonuspunkte ein. Dass die Teilnehmer nicht mehr Verbesserungen als real getätigt angeben, wird per Wikipedia:Geh von guten Absichten aus gesichert. Und auch die strengere Handhabung mit virtuellen Bausteinen ist eingebaut.
  • Bzgl. der Abweichungen bin ich tendenziell der Ansicht von Jens: Dieses System ist genauer, deshalb ist keine absolute Übereinstimmung mit den Bewertungen des alten Modells zu erreichen. Daher die Abweichungen. Eins sollte auch klar sein: Weder ist das Rechensystem absolut gerecht, bis ins Feinste ausgeklügelt noch makellos. Wenn wir das testen, werden sich gewiss Probleme und Schwierigkeiten ergeben. Weil der schiedsrichterliche Ermessensspielraum erhalten bleibt und das System gut modifizierbar ist (sowohl die Formel als auch die (wenigen) erhalten geblieben Kriterien aus dem alten System (Parameter frei)), können wir das bestimmt lösen. Zunächst ist das neue Modell erstmal nur eine Idee, die es wert ist, ausprobiert zu werden. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 19:23, 18. Jul. 2012 (CEST)
Ich habe nochmal zwei Anmerkungen: Weblinks und Literaturangaben sind streng genommen keine Belege und werden daher nicht mit Extrapunkten bedacht, right? In der Anleitung finde ich außerdem keinen Hinweis darauf, dass die Belege "einzigartig" sein müssen, dass also Unterbelege nicht mit Extrapunkten bedacht werden. Aber vielleicht ist es wirklich sinnvoll, auch Unterbelege mit Extrapunkten zu bedenken, der Einfachkeit halber und um die Teilnehmer nicht zu überfordern. Schließlich müssen die Teilnehmer diese Extrapunkte selbst anmelden; das gibt sicher Chaos, weil oft nicht klar ist, was nun Unterbelege sind und was als selbstständig gelten kann. Da häufen sich bestimmt die Fragen auf der Diskussionsseite (z. B. "sind einzelne Artikel von Spigel-Online Unterbelege der Website Spiegel-Online oder sind sie jeweils eigenständig?"). Außerdem würden wir genaue Referenzierung mit Seitenzahlen fördern. Klar kann man damit Punkte schinden, aber das kann man auch mit überflüssigen einzigartigen Belegen. --Jens Lallensack (Diskussion) 19:39, 18. Jul. 2012 (CEST)
Wikipedia:Belege verweist auf alle drei Möglichkeiten: WP:REF, WP:WEB, WP:LIT. Weblinks und Literatur zählen auf jeden Fall. Wie wir das mit den Unterbelegen lösen können... Hmm, schwierige Frage. Ich lasse mir das nochmal durch den Kopf gehen.
Um ein allzu großes Chaos zu vermeiden, gibt es Wikipedia:Wartungsbausteinwettbewerb/Editierhinweise, das als Editnotice beim Bearbeiten der Wettbewerbstabelle erscheint. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 20:01, 18. Jul. 2012 (CEST)
Ok. Aber weiterführende Literatur und Weblinks müssen den Artikel ja nicht zwingend "belegen" (bestes Beispiel: der Commons-Link). Sie können auch einfach als Ergänzung angegeben sein. Ich würde "einschließlich weiterführende Literatur und Weblinks" auf jeden Fall dabei schreiben, vielleicht gibt es Menschen die da genau so drüber stolpern wie ich. --Jens Lallensack (Diskussion) 21:01, 18. Jul. 2012 (CEST)

Hallo. Ich konnte leider nur ab und zu mal hier reinschauen und hab deshalb nicht jeden Beitrag gelesen. Ich teile irgendwie die Bedenken von Laibwächter. Das liegt wahrscheinlich an drei Dingen: 1) Bei meinen eigenen Überarbeitungen lege ich vor allem Wert auf einen knappen Schreibstil. 2) Ich hatte persönlich nie ein Problem mit dem alten Bewertungssystem, da ich recht schnell darin war. 3) Ich hatte mir immer ein Bewertungsschema gewünscht, das noch mehr auf den Inhalt und weniger auf die Masse eingeht. Mein Textbewertungsmodell nach inhaltlichen Punkten statt nach Zeilenzahl habe ich als Schiedsrichter auch zweimal erfolgreich durchgezogen.
Ich kann euer neues Modell leider schlecht einschätzen, vor allem der Teil mit den Kürzungen oder starken Umstellungen ohne große Byteänderung ist mir noch schleierhaft. Ich hab dieses Uwe-Kliemann-Beispiel von der Schiri-Hinweisseite mal probiert und komme nach den neuen Regeln auf 0.8 statt 1.5 Punkte. Dann habe ich versucht, meinen Fuentes-Dopingskandal-Artikel neu auszuwerten. Leider überlastet der das Tool. Das Ergebnis hätte mir geholfen, das neue Modell besser einzuschätzen, da ich mit der damals von Nikkis vergebenen Punktzahl sehr zufrieden war.
Zwei Fragen noch: Warum ist das bytebasierte Modell genauer als das kriterienbasierte? Wie „schätze“ ich die Bytezahl eines Bausteins ab ohne Informatikstudium (nicht, dass ich keins hätte ...)? :) -- Zacke Neu hier? 21:40, 18. Jul. 2012 (CEST)

Hallo Zacke, danke für deine Stellungnahme.
  • 1) Demnach hat dich ja schon das alte System benachteiligt
  • 2) Wer weniger oft Schiedsrichter war oder gerade neu einsteigt als Schiedsrichter, wird sehr viel länger brauchen als du und ich, weil man die Kriterien nicht mal so eben auswendig lernen kann. Von mir kann ich sagen, dass ich ca. fünf Minuten im Durschnitt pro Artikel benötigte. Nun braucht man 2 bis drei Minuten. Der Aufwand halbiert sich.
  • 3) Mehr Genauigkeit = mehr Aufwand. Ich finde deine stringente Durchführung dieser Alternative bewundernswert, ich kann mir aber nicht erklären, wie du es schaffen konntest, damit auch noch relativ schnell zu sein.
Hast du bei Uwe-Kliemann die 0.5 Bonuspunkte für den Beleg gegeben?
Warum ist das bytebasierte Modell genauer als das kriterienbasierte. Ich bin mir nicht sicher, ob es genauer ist. Ich vermute es nur. Zumindest ist die Möglichkeit menschlicher Fehler sehr eingeschränkt.
Schätzen der Bytezahl: 1 Byte = 1 Zeichen. Oder?
Ich nehme an, dass das Modell noch Verfeinerungspotenzial hat. Der Ansatz ist meines Erachtens auf jeden Fall richtig, wenn wir den Aufwand stark senken wollen. Ich ziehe dieses Modell auch noch den beiden anderen Lösungen, die den Aufwand stark senken würden (Zeitmodell, Klasseneinteilung), vor, weil die Genauigkeit bleibt. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 22:15, 18. Jul. 2012 (CEST)
Jep, das alte System hat mich auch schon benachteiligt. Das neue System ist nun leider eine Entwicklung in Richtung Quantität, die mir nicht gefällt. Meine angeführten Punkte sind vermutlich eher eigennützige Gründe. Von daher geh ich mal lieber weiter auf den Rest ein: Für Uwe Kliemann habe ich den halben Bonuspunkt gegeben. Kann gut sein, dass ich einfach die Vorlage falsch verwendet habe. Ich habe die Anleitung auch nur einmal gelesen. Mit dem Schätzen der Bytezahl wollte ich nur andeuten, dass man da vielleicht eher einen Pauschalwert einsetzt, als von den Schiris zu verlangen, Zeichen zu zählen. Ich kann z. B. nicht mal eben abschätzen, wie viele Zeichen in eine Zeile passen. Wobei ich wirklich noch skeptisch bin, ist die „Genauigkeit“ bei umfangreichen Überarbeitungen. Ich konnte ja leider mein Fuentes-Beispiel nicht testen, Laibwächters Flecker hatte eine Abweichung von fast 10%. Ein Beispiel zu einer Kürzung wäre auch nicht schlecht. Mathematisch ist das neue Modell sicherlich genauer, da es größtenteils automatisiert ist. Als Pro-Argument würde ich das aber nicht unbedingt sehen. Wenn man den Aufwand senken will, ist euer System gut geeignet und letztendlich geht Probieren über Studieren! -- Zacke Neu hier? 00:26, 19. Jul. 2012 (CEST)
Je länger ich über das neue System Erwägungen anstelle, desto mehr Bedenken kommen mir. Ich machte bisher meine Punke mit in der Relation wenigen Artikel, die ich inhaltlich (Belege, Bilder, Literatur) qualitativ überdurchschnittlich weit vom Stubniveau her aufpimpte. Dabei waren auch andere User erstaunt, wie viel man aus einem Thema herausholen konnte. Diese inhaltliche Qualität und der Spaß an der jeweiligen Thematik, die nicht immer meinem Schwerpunktthtema (Literatur) entsprechen musste, würde jetzt von der "Gleichmacherei" eines tw. automatisierten Systems um 10 % ihres Spaß und somit auch eines nicht gering einzuschätzenden Befriedigungsfaktors zum Opfer fallen. Das ist in meinen Augen kaum plausibel und noch weniger akzeptierbar. (Ich habe es beim letzten WBW auch mit Mikroveränderungen versucht, hat geklappt, fand ich aber völlig unbefriedigend)
Zumal das Aufpimpen mit aufgeblähtem Tabellenlayout bei Listen ohne gleichzeitigen inhaltlichen Neuwert auch bisher viel zu hoch bewertet wurde.
Die inhaltlich katastrophalen Sportereignisparaphrasen eines Sockenpuppenspielers, der uns hoffentlich zum letzten mal im Wettbewerb heimgesucht hat, würden dem neuen System noch nicht einmal auffallen. Dessen fehlerdurchsetzter Schreibdurchfall würde sogar noch gegenüber weitaus ausgefeilteren und belegten Artikeln überproportional Vorteile genießen – und damit wäre unser Wartungsbausteinwettbewerb, der nun einmal der qualitativen Verbesserung dienen sollte, völlig pervertiert.
Die völlige Ausblendung des von mehreren Usern favorisierten Eigenbewertungsmodell bei Mikroveränderungen in Verbindung mit der Bewertungs-Pipeline Harros hätte immer noch den Vorteil der Transparenz, ohne das wir inzwischen gefühlte 90 % unser bisherigen Bewertungskriterien einfach über Bord werfen.
Jetzt sich einfach auf ein verführerisches Modell einzulassen, dass einem - sorry, aber für unwillige Schiris wird es das Motiv sein - das Denken abnehmen soll und dessen Praxisanwendung noch überhaupt nicht überlegt wurde, erscheint mir bei der geringen Diskussionsgrundlage (Zacke hat sich ja dankenswerterweise gemeldet, aber wo bleiben die anderen, Nikkis hat eine ganze Zeit keine Erfahrung mehr beim Auswertung, für Jens war es in zweifacher Hinsicht das erste mal) verfrüht. --Laibwächter (Diskussion) 09:54, 19. Jul. 2012 (CEST)
  • Es ist nicht so, dass ich deine Bedenken gar nicht nachvollziehen könnte. Wie oben bereits ausgeführt, ist das Modell in der Tat gleichmacherisch. Was mir aber nicht einleuchtet, ist dein Argument, dass dieses Modell noch gleichmacherischer sei als das alte: Eine Zeile = 1 Punkt. Das ist das alte Modell. Jetzt gehen wir nach den hinzugefügten Bytes und verrechnen dies mit der Ähnlichkeit zur mangelhaften Version, was kein Schiedsrichterauge jemals so gut erkennen konnte wie dieses externe Werkzeug. Was sich also verändert, ist das System der quantitativen Bewertung. Die qualitative Bewertung bleibt hingegen unangetastet. Schiedsrichterliche Ermessensspielräume werden nicht beschnitten, bleiben komplett enthalten. Die Rechenformel soll die Schiedsrichter nicht entmündigen, sondern sie unterstützen, das quantitative Bewerten vereinfachen und beschleunigen. Sie greift nur auf der Ebene der Quantität, nicht der Qualität. Das Denken kann uns kein Werkzeug der Welt abnehmen.
  • Worüber wir noch diskutieren können: Die Formel ist beliebig modifizierbar. Das heißt, man könnte auch noch den Faktor Qualität als Parameter einbauen. Dieser steht standardmäßig (wenn er nicht eingesetzt wird) auf 1. Indem man zum Beispiel 0.9 angibt, vergibt man nur noch 90 Prozent der Punkte (zum Beispiel bei Mängeln, übermäßig langen und vielen Zitaten, byteverbrauchenden Tabellen, Infoboxen, Listen). Wenn man 1,1 angibt, vergibt man 110 Prozent usw. Im Grunde genommen übernimmt die Aufgabe, den schiedsrichterlichen Ermessensspielraum zu erhalten, bereits der Parameter frei, aber mit einem zusätzlichem Parameter Qualität wäre das noch evtl. eingängiger. Folgende Richtlinie war und ist in Hinblick auf eine qualitativ gerechte Bewertung die wichtigste: Ihre Ermessensspielräume können Schiedsrichter immer dann ausnutzen, wenn sie den Eindruck haben, dass der Aufwand und der erarbeitete Mehrwert der vorgabetreuen Bepunktung nicht gerecht wird. Das Denken wird einem nicht abgenommen, was natürlich zu einer gewissen Subjektivität der Bewertung führt. Diese Subjektivität lässt sich objektivieren, indem man eine Doppelbewertung durchführt oder Schirikollegen um eine weitere Meinung bittet.
  • Das von mehreren Usern favorisierte Eigenbewertungsmodell bei Mikroveränderungen ist im neuen Modell eingebaut.
  • Ein paar Sätze zu der von dir eingeführten Phrase der Unwilligkeit der Schiedsrichter: Das Bewerten ist eine monotone Arbeit. Das kann man anders nicht sagen. Monotonie unterfordert. Unterforderung gleich Langeweile. Langeweile gleich Frustration. Deshalb ist es nicht verwunderlich, dass nicht so viele bei der Frage Wer will schiedsrichtern? aufspringen. Ein nicht ausreichend besetztes Schiriteam steht also vor einem überdimensional großen Haufen Arbeit. Je überdimensionaler das zu leistende Arbeitspensum, desto niedriger die Motivation, Schiedsrichter sein zu wollen. Das ist eine Abwärtsspirale. Die einzige Möglichkeit, diese Abwährtsspirale zu durchbrechen, liegt darin, den Haufen Arbeit zu reduzieren. Je weniger Arbeit, desto erträglicher das Schiriamt. Desto erträglicher das Schiriamt, umso mehr Freiwillige. Willkommen in der Aufwärtsspirale. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 12:42, 19. Jul. 2012 (CEST)

Ich habe lange hier nur schweigend mitgelesen und bin nach wie vor der Meinung, dass das alte Bewertunsgsystem nicht unbedingt hätte über den Haufen geworfen werden müssen, aber je länger ich hier mitlese, desto sympatischer wird mir das neue Bewertungsmodell. Einen Versuch würde ich tatsächlich einmal riskieren wollen, einfach weil ich glaube, dass das System tatsächlich eine Zeitersparnis für Schiris sein könnte. Allerdings würde ich tatsächlich einen zusätzlichen Qualitäts-Parameter in der Vorlage begrüßen, denn für die oben von Nikkis genannten Fälle würde es mir als Schiedsrichter wesentlich einfacher fallen einen Prozentsatz für Boni/Abzüge anzugeben als einen festen, absoluten Wert im Paramter "frei". -- Gruß  Sir Gawain Disk. 15:12, 22. Jul. 2012 (CEST)

Hallo, da ich bis vor zwei Tagen noch im Urlaub war, habe ich mich in die neue Bewertungs-Diskussion nur teilweise eingelesen. Mit der o.g. neuen Rechenformel könnte ich wohl auch anfreunden, zumal sie natürlich im Gegensatz zur bisherigen noch um einiges schneller ist (wobei ich bekanntermaßen auch mit dem bisherigen Bewertungssystem zufrieden war).
Um ein Gefühl für das neue Bewertungsmodell zu bekommen, habe ich mal alle Artikel der "Alte-Steinchen-Liebhaber" aus dem letzten WBW durchgespielt. Da die Rechenvorlage aber einen Fehler zu haben scheint, bin ich die Artikel von Hand durchgegangen, daher fehlen wahrscheinlich mit einzubeziehende Bonuspunkte. Das Ergebnis findet sich auf meiner Spielwiese und es fällt auf, dass bei der Hälfte der Artikel hohe Negativdifferenzen entstehen. Bei einigen Artikeln sind die Ergebnisse dagegen recht ähnlich oder sogar fast gleich. An der Formel müsste also wohl noch etwas gefeilt oder eben über die Bonuspunkte noch etwas gedreht werden. Es lässt sich natürlich auch nicht ausschließen, dass die Unterschiede durch die individuelle Bewertung der verschiedenen Schiedsrichter zustandegekommen ist. Dazu müsste evtl. nochmal ein anderer Schiedsrichter die Artikel nach dem bisherigen System prüfen.
Alles in Allem wäre es schön, hier noch einmal die letzte aktualisierte neue Bewertungsformel samt möglicher Boni zusammengefasst darzustellen und den Fehler in der Rechnungsvorlage zu beheben (Dokumentation wäre auch nicht schlecht, damit man die Eingabemöglichkeiten der "Stellschräubchen" sieht), damit sich die zurückgekehrten Urlauber ein besseres Bild machen können ;-) Gruß -- Ra'ike Disk. LKU WPMin 20:01, 25. Jul. 2012 (CEST)

Sommer 2012

Ich bin bis Mitte August im Urlaub. Von daher müsstet ihr die Terminfindung unter euch ausmachen. Gruß, --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 06:46, 21. Jul. 2012 (CEST)

Bitte nicht vom 28.08.-04.09. ;-) --WissensDürster (Diskussion) 17:46, 22. Jul. 2012 (CEST)
Bin zurück aus dem Urlaub. Also festlegen sollten wir uns jetzt schon. Ich würde sagen, dass es nächste Woche freitag losgehen sollte. Dass dein Abwesenheitszeutraum unberührt bleibt, lässt sich nicht ganz vermeiden, aber der Wettbewerb läuft ja ganze 15 Tage, für Schiris sogar 17. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 08:31, 13. Aug. 2012 (CEST)
Schade, bin genau in den anvisierten zwei Wochen im Urlaub. Falle dann leider auch als möglicher Schiri aus. -- Gruß  Sir Gawain Disk. 20:17, 13. Aug. 2012 (CEST)
Das ist natürlich ärgerlich, aber gerade im Sommer ist es wohl unmöglich, dass es allen passt. Vielleicht klappt's ja beim nächsten Mal wieder. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 22:16, 13. Aug. 2012 (CEST)
Bin gespannt, wie viele Schiedsrichter sich trotz deines sehr kurzfristigen Termins melden werden. -- Gruß  Sir Gawain Disk. 22:28, 13. Aug. 2012 (CEST)
Also ich bin noch im Urlaub und hätte nichts dagegen, wenn wir es noch eine Woche aufschieben. Auch sind wohl noch nicht alle Durchführungsdetails geklärt. Ich habe, wie bereits angemerkt, keine Lust, mit mehreren Vorlagen und Tabellen herumzuhantieren. Da gibt es jetzt schon wieder eine separate Bewertungsvorlage und die muss irgendwie mit Artikel, Team und Gesamtwertung zusammengebracht werden. Und es gibt die Meldung der Teilnehmer und die Ergebnistabelle. Ich hole meinen Vorschlag noch einmal heraus: Jeder Teilnehmer bekommt eine Vorlage für eine Tabellenzeile, dort trägt er den Artikel und seinen Namen ein. Die Zeile kommt aufs Fließband. Ein Schiri nimmt sich dort den ältesten Beitrag weg, bewertet ihn und fügt die Zeile in die Ergebnistabelle des jeweiligen Teams ein. So stelle ich mir einen ganz einfachen Ablauf vor, bei dem wir auch am einfachsten Zuteilungshängepartien vermeiden könnten. Gruß -- Harro (il cane bau bau) 02:00, 16. Aug. 2012 (CEST)
Meinetwegen können wir den Termin auch noch aufschieben, nur entscheiden sollten wir uns.
Nein, es gibt nur eine einzige Vorlage. Dies ist die Rechenvorlage. Da es keine seperate Auswertungsseite mehr gibt, fällt der Bedarf an einer Bewertungs-Pipeline meines Erachtens weg. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 10:54, 16. Aug. 2012 (CEST)
Also als Starttermin zur Wahl 24. August / 31. August / 7. September? Oder haben wir nach hinten ein Limit?
Und wie funktioniert jetzt dann im Detail die Meldung und Auswertung? Mir ist alles recht, wenn dabei nichts mehr doppelt geführt wird und keine Zuteilungen mehr nötig sind. Gruß -- Harro (il cane bau bau) 00:58, 17. Aug. 2012 (CEST)
Ich befürworte den siebten September. Dann sind bestimmt die meisten aus dem Urlaub zurück und auch mir selbst passt es besser.
Ich habe das alles auf Wikipedia:Wartungsbausteinwettbewerb/Hinweise für Schiedsrichter näher ausgeführt. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 09:15, 17. Aug. 2012 (CEST)
Das kenne ich und das ist auch gut so. Aber wie kommt die Wettbewerbstabelle zustande? Sieht die aus wie bisher / wie in der "Schiedrichterschule"? Wie funktioniert Meldung, Erfassung der Bewertung, (Team-)Abrechnung, Gesamtstand? Wie kommt der Schiri zum Artikel? Ich möchte einfach mal gedanklich den gesamten Ablauf durchspielen, damit wir dann nicht nach dem Start auf Probleme stoßen. Gruß -- Harro (il cane bau bau) 11:35, 18. Aug. 2012 (CEST)
Die Teilnehmer tragen die Artikel ganz normal in die Wettbewerbstabelle ein, in Klammern die für die Bonuspunkte relevanten Infos (wird per Editintro erklärt). Die Schiedsrichter setzen dahinter einfach die Rechenvorlage und füllen sie aus. Wie die Rechenvorlage aussieht, kannst du durch Ausprobieren schauen (hier ein Beispiel). Um das Zusammenzählen kümmert sich der A-Schiedsrichter. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 14:52, 18. Aug. 2012 (CEST)
Dürfen sich die Schiedsrichter die Artikel zum Auswerten selbst aussuchen (ihr Arbeitspensum selbst festlegen) oder bekommen sie Artikel (wie im letzten WBW) zugeteilt? Ich würde vorschlagen, die Schiedsrichter setzten selbstständig ihr Kürzel hinter denjenigen Artikeln, die sie in Kürze bewerten wollen, unter den Bedingungen, dass die Artikel eines Teams der Reihe nach abgearbeitet werden müssen und dass nicht mehr als 50 % der Artikel eines Teams von einem einzigen Schiedsrichter bewertet werden darf. Wenn wirs so machen, gibt es keinen Leerlauf für besonders aktive Auswerter mehr und das ganze wäre vielleicht schneller. Ansonsten würde mich der Introtext für die Teilnehmer interessieren, insbesondere, wie wir den Teilnehmern unmissverständlich erklären, dass Unterbelege nicht zählen. --Jens Lallensack (Diskussion) 15:09, 18. Aug. 2012 (CEST)
Wenn der Wettbewerb am 7. September startet, wäre ich (auch als Schiedsrichter) mit von der Partie.
Eine andere Baustelle, aber vor dem Wettbewerbsbeginn sollte es - denke ich - geklärt werden, deshalb verweise ich auf meinen Beitrag auf der Disk.seite der Hinweise für Schiedsrichter. -- Gruß  Sir Gawain Disk. 17:29, 20. Aug. 2012 (CEST)
Jens: Die zu bewertenden Artikel werden den Schiedsrichtern nicht fest zugeteilt. Allerdings gilt die Richtlinie, dass ein Schiedsrichter unbedingt Verbesserungen verschiedener Teams bewerten sollte, das eigene Team darf nicht bewertet werden. Es findet also keine Zuteilung statt. Durch Prozentangaben und weitere Richtlinien würde ich das nicht noch weiter verkomplizieren, ich denke, dass die zitierte Richtlinie genügen sollte.
Deine Idee mit der Reservierung durch Hinzufügen des Schiribuchstabens ist wirklich sinnvoll, damit Bewertungskonflikte, also unbeabsichtigte Doppelbewertungen vermieden werden. Der Introtext sieht so aus. Ob das unmissverständlich ist, wird sich zeigen. Unmissverständlichkeit ist erfahrungsgemäß nicht zu erreichen ;-).
Sir Gawain: Ich habe dir dort geantwortet. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 19:17, 21. Aug. 2012 (CEST)

Einfügung von Wartungsbausteinen „für WBW“

Wie man hier sehen kann, hat Benutzer:LZ6387 gestern Abend innerhalb einer Stunde ungefähr zwei Dutzend Artikel mit Wartungsbausteinen versehen, und zwar explizit für diesen Wettbewerb („für WBW“). Ich halte diese sekundäre Motivation zur Setzung von Wartungsbausteinen nicht für akzeptabel. Wartungsbausteine zu setzen, um sie dann selber wieder wegzuarbeiten, ist der falsche Weg. Wenn man Mängel beseitigen kann, sollte man das gleich tun. Wenn man es nicht kann und wirklich ernsthafte Mängel vorliegen, dann kann man Wartungsbausteine setzen. Anderweitige Verbesserungswünsche sind besser auf der jeweiligen Artikeldiskussionsseite aufgehoben. -- Robert Weemeyer (Diskussion) 08:18, 7. Sep. 2012 (CEST)

Die Regel lautet: Vor Wettbewerbsbeginn selbst gesetzte Wartungsbausteine können ebenfalls abgearbeitet werden. Geht also prinzipiell in Ordnung, auch wenn es der Teilnehmer wohl etwas ausgereizt hat. Weil es sich nur um einen Einzelfall handelt, braucht es aber (erstmal) keiner Regelverschärfung. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 12:21, 7. Sep. 2012 (CEST)
Wir brauchen hier die klare Regelung "nur Artikel mit Wartungsbaustein zählen", da die Alternative mit den "virtuellen Bausteinen" Chaos verursacht hat. Ich verstehe nicht, wo hier das Problem liegt; wenn der Benutzer diesen Wettbewerb zur Motivation für die Überarbeitung bestimmter Artikel nutzen will, lass ihn doch soviele Bausteine einfügen und abarbeiten wie er möchte, dadurch werden die Artiel doch besser? Warum sollte das jemanden stören? --Jens Lallensack (Diskussion) 14:20, 7. Sep. 2012 (CEST)

Herbst 2012

Hallo Jungs! Wir sind ja schon mitten im Herbst. Deshalb wollte ich mal anfragen, wann wem welcher Zeitraum lieb wäre, für den nächsten Wettbewerb?! Da es sicher noch etwas Vorbereitungszeit braucht, aber auch nicht zu weit ins den nächsten Monatg schlittern sollte, dachte ich etwa an ab dem 16.11.? Lasst einfach mal hören, wann es euch so passt :) --WissensDürster (Diskussion) 10:53, 25. Okt. 2012 (CEST)

Hallo Mädels! Ich finde den Terminvorschlag ab 16.11. sehr gut. Da stünde ich als Schiedsrichter zur Verfügung und könnte auch aktiv als WBW-Teilnehmer dabei sein. Wir sollten auf jeden Fall versuchen, nicht zu weit in den Dezember zu rutschen, weil dann schon viele durch Weihnachtsaktivitäten beschäftigt sind. -- Gruß  Sir Gawain Disk. 15:59, 27. Okt. 2012 (CEST)
... und wenn ihr mir versprechen könnt die Auswertung bis zum 21.12. sicher zu stellen, bin ich trotz des WikiCups als Teilnehmer dabei ;-) --Laibwächter (Diskussion) 17:48, 27. Okt. 2012 (CEST)
Ich bin auch mit dem 16.11. einverstanden. Laibwächter, mit dir als Mitschiedsrichter sollte das hinhauen ;-) --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 12:54, 28. Okt. 2012 (CET)
Die Betonung liegt bei mir auf Teilnehmer. Wenn ich unsere Tricktrias irgendwie im WikiCup einholen möchte, muss ich mich an anderen Orten beschränken. ;-) --Laibwächter (Diskussion) 22:22, 28. Okt. 2012 (CET)
Archivierung dieses Abschnittes wurde gewünscht von: --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 17:13, 14. Dez. 2012 (CET)

Ohne Bausteine, aber ...

Ich würde gerne das Projekt Qualitätssicherung Artikel historische Waffen zur Auswertung als QS beantragen. Grund: Wir haben dort bewußt keine Bausteine eingesetzt. Sämtliche noch unbearbeitete Artikel fallen mehr oder weniger gleichzeitig in die Kategorien: Überarbeiten, Belege fehlen, Defekte Weblinks - dazu muss immer die Relevanz geprüft werden. - Mir wäre auch Behandlung als "virtuell" recht (könnte so 100 indonesische Ethnografika wegschaffen, aber ein bißerl Zucker ...?). Gruß, --Emeritus (Diskussion) 18:24, 9. Nov. 2012 (CET)

Verlinke die Liste einfach bei der Ergänzung der Artikel. Wartungslisten im Benutzernamensraum sind eigentlich etwas kritisch, diese ist aber so angelegt und organisiert, dass sie den Fach-QS-Seiten gleicht. Wenn der behobene Mangel im jeweiligen Artikel eindeutig einem WB zugeordnet werden kann, gibt's volle Wertung, sonst halbe. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 18:40, 9. Nov. 2012 (CET)
Ok, ich habe mal dafür den Shortcut WP:QHW angelegt. --Emeritus (Diskussion) 19:52, 9. Nov. 2012 (CET)
Also, ich hänge als Hinweis immer kurz vor Wettbewerbsbeginn einen Permalink der QS-Liste in den todo-Abschnitt meiner Gruppe, da wir im Mineralreich auch nicht an jeden Artikel ein QS-Bapperl hängen ;-) -- Ra'ike Disk. LKU WPMin 22:21, 9. Nov. 2012 (CET)
Archivierung dieses Abschnittes wurde gewünscht von: --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 17:13, 14. Dez. 2012 (CET)

Abstimmung über virtuelle Wartungsbausteine

Werte Wartungsbausteinwegarbeiter!

In vielen Wettbewerben zuvor, in diesem jedoch verstärkt, kam der Wunsch auf, über das Verfahren mit virtuellen Wartungsbausteinen (siehe WP:WBW#Artikelauswahl) abzustimmen, um die Frage hoffentlich endgültig klären zu können und somit wiederholt langwierige Diskussionen zu vermeiden. Die aktuelle Diskussion dazu findet sich hier. Aus dieser können diverse Pro-und-Contra-Argumente entnommen werden.

Die Abstimmungsoption, welche die meisten Stimmen (Modus (Statistik)) auf sich vereinigt, wird umgesetzt, sofern die Abstimmung nicht mehrheitlich abgelehnt wird. Folgende Abstimmungsoptionen stehen zur Verfügung:

  1. Status quo. Aktuell wird für die Abarbeitung virtueller Bausteine die halbe Punktzahl vergeben (prozentualer Anteil = 50).
  2. Vergabe eines anderen prozentualen Anteils der Punktzahl. Die Angabe 30 fordert beispielsweise, dass nur noch 30 Prozent der Punktzahl vergeben werden sollen. Angaben bitte aufsteigend sortieren! Sollte eine Mehrheit für diese Option abstimmen, wird der Median ermittelt.
  3. Abschaffung der virtuellen Wartungsbausteine. Virtuelle Wartungsbausteine werden konsequent nicht mitbewertet.

Es besteht die Möglichkeit der Enthaltung und Ablehnung der Abstimmung.

Bezüglich der Forderung, im Einzelfall zu entscheiden, bitte ich darum, meinen Beitrag dazu zu beachten.

Um die Aufmerksamkeit zu nutzen, die der laufende Wettbewerb beschert, beginnt die Abstimmung heute und endet am 5. Dezember (24h). Stimmberechtigt sind alle, die schonmal an einem Wettbewerb, sei es als Teilnehmer oder Schiedsrichter, beteiligt waren. Auf den momentan noch laufenden Wettbewerb hat diese Abstimmung selbstverständlich keinen Einfluss.

Frohes Abstimmen! --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 10:34, 20. Nov. 2012 (CET)

Sorry, aber wie kannst du allen Ernstes jetzt nach einer derart unentschiedenen Abstimmung einfach virtuelle Bausteine abgeschafft eintragen? Alle Beteiligten sind sich letztendlich unschlüssig, was man damit anfangen soll. --Laibwächter (Diskussion) 11:27, 6. Dez. 2012 (CET)
Wichtig ist, dass wir die neue Regel zu Beginn des nächsten Wettbewerbs deutlich machen, dann dürften da keine Unklarheiten auftauchen. Ich werde das ins Editintro einbauen, das sollte dann deutlich genug sein. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 13:38, 6. Dez. 2012 (CET)
Ich finde es auch seltsam, andererseits war es der Vorschlag mit den meisten Stimmen (Enthaltungen werden ja sonst auch nicht gezählt). Grüße LZ6387 Disk. Bewertung 14:19, 6. Dez. 2012 (CET)
Also am Ergebnis der Abstimmung selbst gibt es nix zu deuteln. Es gibt Abstimmungen mit eindeutigerem Ergebnis, aber auch welche, die noch knapper ausgefallen sind. Knappe Ausgänge ändern nichts an der Gültigkeit. Dass die Frage umstritten ist und dass sich diese Umstrittenheit auch in der Abstimmung widerspiegelt, war schon von vornherein vorhersehbar. Gerade deshalb denke ich, mal ganz abgesehen von dem Ausgang, ist es gut, die Abstimmung durchgeführt zu haben. So haben wir jetzt endlich mal eine endgültige Entscheidung. Das ist sicherlich vorteilhaft, für Teilnehmer und Schiedsrichter. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 17:50, 6. Dez. 2012 (CET)

Status quo

  1. --alexscho (Diskussion) 10:49, 20. Nov. 2012 (CET)
    --Stanzilla (Diskussion) 12:22, 20. Nov. 2012 (CET) Es ist so schon kompliziert genug. Ich hoffe einfach, dass die Bausteinentferner selbst vernünftig genug sind, Bausteine zu entfernen oder Artikel zu bearbeiten, die es nötig haben und die Regelung nicht zu missbrauchen.
  2. --LZ6387 Disk. Bewertung 13:01, 20. Nov. 2012 (CET)
  3. -- Harro 03:09, 21. Nov. 2012 (CET) Halte ich für einen guten Kompromiss zwischen allen berechtigten Standpunkten: hält nicht davon ab, notwendige kleine Verbesserungen mitzunehmen, bei großer "spontaner Privat-QS" verschenkt man aber auch viele Punkte. Und es nicht zu erlauben wäre gegenüber "geplanter Privat-QS" unfair. Zudem ist die Regel einfach und unbürokratisch.
  4. --Bebbe (Diskussion) 10:00, 21. Nov. 2012 (CET)
  5. -- Lukas²³ | Bew | WPVB | Plattenladen 03:16, 22. Nov. 2012 (CET)

Vergabe eines anderen prozentualen Anteils

Abschaffung

  1. Mir ist es wichtig, dass es beim Wartungsbausteinwettbewerb auch wirklich um Wartung und Entfernen von Bausteinen geht, nicht um das Rumpuzzeln am Lieblingsthema :-) Ich könnte mir auch weniger radikale Lösungen vorstellen als die vollständige Abschaffung der virtuellen Bausteine (siehe verlinkte Diskussion), aber von den hier zur Verfügung stehenden Optionen passt diese am ehesten.--Berita (Diskussion) 13:13, 20. Nov. 2012 (CET)
  2. Der ewige Hick-Hack hätte dann endlich ein Ende. Und mir kann niemand erzählen, dass er keine "echt bepapperlten" Artikel in seinem Intressenkreis finden würde. -- Gruß  Sir Gawain Disk. 18:46, 20. Nov. 2012 (CET)
  3. Ich denke Abschaffen würde zumindest für Klarheit sorgen. Lómelinde Diskussion 20:16, 20. Nov. 2012 (CET)
  4. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 17:28, 21. Nov. 2012 (CET)
  5. Ein virtueller Baustein ist aus meiner Sicht nichts anderes als ein privater Merker eines Bearbeiters für einen Artikel an dem er was ändern möchte. Allerdings wird das nicht öffentlich gemacht und kein anderer Bearbeiter hat die Möglichkeit, Informationen beizusteuern. Ich halte es für klarer, wenn nur öffentliche Bausteine gewertet werden. --Dirts(c) (Diskussion) 08:45, 22. Nov. 2012 (CET)
  6. --CENNOXX 22:49, 1. Dez. 2012 (CET)
  7. Es geht im WBW doch um das Verringern der Bausteinmenge. Virtuelle Bausteine gehören nicht zu dieser Menge, zudem kommt es immer wieder auch zu Diskussionen, ob eine Bearbeitung eines virtuellen Bausteins wirklich im Sinne einer QS nötig war oder ob es sich nur um eine Verbesserung eines bereits guten Artikels handelte. Es gibt genug Bausteine für alle, die unbedingt bearbeitet werden sollten. Virtuelle braucht es in diesem Wettbewerb daher nicht. --Paulae 12:42, 2. Dez. 2012 (CET)

Enthaltung

  1. Ich finde: Entweder, sie sollten ganz gezählt werden oder gar nicht. Diese 50-%-Regelung demotiviert doch nur. Ich vermisse aber die Abstimm-Möglichkeit, dass Virtuelle Bausteine, die begründbar offensichtlich mangelhaft sind, voll gezählt werden sollen. --Jens Lallensack (Diskussion) 10:49, 20. Nov. 2012 (CET)
  2. Es gibt virtuelle Bausteine, die voll zählen sollten (Wartungskategorien, defekte Weblinks). Es gibt aber bestimmt auch virtuelle Wartungsbausteine, die man nur teilweise oder gar nicht zählen sollte. Ich kann mich da nicht entscheiden, deshalb hier. Gruß, Siechfred Cradle of Filz 10:52, 20. Nov. 2012 (CET)
    dazu siehe hier --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 11:12, 20. Nov. 2012 (CET)
  3. -- Ra'ike Disk. LKU WPMin 13:35, 20. Nov. 2012 (CET) Bin etwas unentschlossen. Status quo (50%) für echte virtuelle Bausteine ist zwar ok, wobei man die nach meinem Empfinden auch abschaffen könnte, denn es geht ja hier streng genommen darum, Wartungsbausteine abzubauen. Es fehlt mir aber oben zum einen die Präzisierung, dass die Artikel der FachQS-Wartungslisten (die nicht immer einen Baustein tragen) ausgenommen sind. Zum anderen denke ich auch, dass man Einzelfallentscheidungen zulassen sollte wie z.B. neue und/oder zufällig entdeckte Artikel, die begründbar offensichtlich mangelhaft sind. Um die Entscheidungslast für Schiris abzumildern, wäre durchaus die Möglichkeit denkbar, dass mindestens 3 Schiris einem vorherigen Wertungs-Antrag zustimmen müssen.
    Artikel von Wartungslisten gelten nicht als virtuell --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 17:32, 21. Nov. 2012 (CET)
  4. Prinzipiell gegen virtuelle Bausteine. Aber das "Verbot" kann man ja umgehen, indem Mitspieler dazu verleitet werden, einige Zeit im Voraus selber Bausteine zu produzieren. Also mich selbst würde es im Finger jucken, z.B. bei Querdisparation (keine Belege), den Baustein zu keinen Quellen hinzuzufügen. Es würde also evtl. die Wettbewerbsarbeit im Vorfeld geplant. Überlegung dazu: Ließe sich kontrollieren, dass man nie eigene - egal wann gesetzt - Bausteine abarbeiten kann? --WissensDürster (Diskussion) 14:02, 20. Nov. 2012 (CET)
  5. Ich bin noch unentschlossen. Prinzipiell geht es ja beim WBW um Wartungsbausteine. Sonst wäre der Name ja Qualitätsverbesserungs- oder Qualitätssicherungswettbewerb. Die Lösung virtuelle Bausteine halb zu bewerten ist an und für sich ja pragmatisch und gut, benachteiligt allerdings tatsächlich diejenigen, die nicht vor dem Wettbewerb noch Baustein-Kreuzzüge durchführen.--Emergency doc (Diskussion) 18:40, 21. Nov. 2012 (CET)

Gegen diese Abstimmung & Alternativvorschlag

  1. virtuelle Bausteine haben mich eher amüsiert, da sie in sich widersprüchlich sind. Wenn ein eindeutiger Mangel vorhanden ist, den der User beseitigen möchte, dann hat er ihn bereits vor dem Wettbewerb erkannt und kann IMHO dann auch bereits einen Baustein setzen. Wenn er diese Maßnahme scheut, weil irgendein thematischer Platzhirsch Bausteinschubserei reklamieren könnte, dann ist der Mangel wohl nicht so groß gewesen. Mein Fazit als Schiedsrichter: In 90% aller von mir gesichteten VB-Artikeln wäre ein Lückenhaft- oder Quellen-Baustein berechtigt gewesen. 10% war verhuschter Artikelausbau, der zwar dem Artikel gut tat, aber zuvor nicht als Mangel angesehen worden wäre. Viel einfach wäre die Lösung auch während des WBW das Platzieren von Bausteinen zu erlauben. Denn jeder gerade aufgeschlagene Neuartikel könnten einen benötigen... --Laibwächter (Diskussion) 17:34, 20. Nov. 2012 (CET)
  2. Sollte tatsächlicher (nicht nur "gefühlter") Missbrauch mit dem virtuellen Baustein betrieben werden, so könnte ich mir höchstens vorstellen, die Verwendung zu beschränken, z. B. auf maximale Anzahl oder auf maximale Punktzahl, also bspw. maximal fünf VWBs oder maximal 50 Punkte durch VWBs pro Teilnehmer/Team. Aber eine völlige Abschaffung wäre unter dem Strich auch wieder kontraproduktiv, wenn dann notwendige Verbesserung unterbleiben würde. -- Harro 03:17, 21. Nov. 2012 (CET)

Ablehnung

Archivierung dieses Abschnittes wurde gewünscht von: --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 17:13, 14. Dez. 2012 (CET)

Diskussionspunkte bis zum kommenden Wettbewerb

Belegwertung

Aus Gründen der Vereinfachung Streichung der detaillierten (komplizierten) Regeln zu verschiedene Belege, Auszählung wird an Schiris übergeben

  • Möglichkeit: Alle Neueinträge unter Literatur, Weblinks und Einzelnachweise werden gezählt. Doppelte Nennungen werden nicht gewertet. Webseiten der gleichen Domain und Einzelnachweise des gleiches Werks mit unterschiedlichen Seitenangaben werden hingegen berücksichtigt, solange dies nicht überhand nimmt (mehr als 10 Webseiten einer Domain / mehr als zehn Angaben des gleichen Werks). (sehr einfache Regelung, weil letztgenannte Ausnahme sehr selten vorkommt: in diesem Fall wird massige Referenzierung nicht mehr belohnt)
Dagegen. Bei Chartangaben ist es üblich, die Interpretenübersicht zu verlinken. Im Rahmen des WBW habe ich erlebt, dass jemand einfach jedes Lied einzeln verlinkt hat, um Punkte zu schinden. Das war schon bei halber Punktzahl nicht in Ordnung, bei voller Punktzahl wäre das einfach nur noch unfair. Relevante Webseiten zu einem Thema sind doch meist untereinander verlinkt, ein Thema nimmt in einem Buch meist ein geschlossenes Kapitel ein. Das ist im Normalfall kein wesentlicher Rechercheaufwand. Einfacher ist immer ungerechter, aber dann sollte man den Normalfall zum Maßstab machen. -- Harro 21:33, 25. Jan. 2013 (CET)
Dann sollte es aber Sonderregeln für Datenbanken und Datensammlungen geben. Wenn man Zeitungsausschnitte nur bei http://news.google.com/ findet, sollte mehrere Zeitungsartikel nicht als nur ein Nachweis gelten, so wie es beim letzten Wettbewerb war. Das gleiche gilt auch für google books. Vielleicht sollten wir nochmal die Diskussionen zu dem Thema aus dem Herbstwettbewerb aufnehmen.--Killikalli 20:33, 26. Jan. 2013 (CET)
Die Datenbank verringert zwar den Rechercheaufwand, andererseits muss man ja nur schlau genug sein und die einzelnen Originalzeitungen und -bücher als Quelle anzugeben und nicht den Google-Link. Die Zählung bezieht sich also immer auf die Publikationen, in der die Information ursprünglich veröffentlicht wurde, nicht die Datenbank, die diese Publikationen reproduziert. Etwas anderes macht keinen Sinn. -- Harro 13:34, 27. Jan. 2013 (CET)
"Schlau genug" heißt dann aber, den Weblink auf die Quelle einfach wegzulassen, wenn es keine Möglichkeit gibt, auf die Originalzeitung direkt zuzugreifen. Dann wären es nach den alten Regeln unabhängige Quellen, ansonsten galt es im letzten Wettbewerb als eine Quelle (siehe verlinkte Diskussion oben). Man würde dann zwar eine komplette Quellenangabe machen (Titel, Zeitung usw), aber ohne Link auf die Fundstelle im Netz, nur um die Punkte für den Beleg zu bekommen. Und das kann doch nicht im Sinne des WBW oder der Belegpflicht sein. --Killikalli 14:08, 27. Jan. 2013 (CET)
Das wollte ich eigentlich sagen. Wenn wir die Google-x-Links nicht ausnehmen, dann würden "die Schlauen" einfach nicht mehr verlinken, was kontraproduktiv wäre. Deshalb kommen wir gar nicht darum herum, Adressen die mit x.google.com beginnen (und vergleichbare) auszunehmen. Ich wollte nur klarstellen, dass es da keinen Zweifel geben kann. -- Harro 15:27, 27. Jan. 2013 (CET)
Dann waren wir uns ja eigentlich einig :)--Killikalli 21:57, 27. Jan. 2013 (CET)

Umgesetzt werden sollte, dass die Auszählung (wieder) von den Schiris übernommen wird, das Auszählen durch die Teilnehmer hat letztes Mal für Verunsicherung gesorgt und im Endeffekt haben die Schiedsrichter dann doch häufig nachgezählt, um sicher zu gehen. Die neue Bewertungsidee stell ich dann erst nochmal zurück, mir fällt momentan keine wirklich gute Lösung ein. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 17:52, 8. Feb. 2013 (CET)

Wie wäre es damit: "Mehrere Webseiten, die der gleichen Domain angehören, gelten als nur ein Beleg. Ebenso werden mehrfache Aufführungen der gleichen Literaturangabe, auch wenn unterschiedliche Seiten genannt werden, in der Zählung zu einem Beleg zusammengefasst. Stammen die Literaturstellen doch von verschiedenen Autoren (z.B. bei Sammelwerken etc.), so zählt jeder Autor, selbst wenn die Belege aus derselben Quelle stammen."? --Flominator 16:49, 9. Feb. 2013 (CET)

Ich hatte grade nochmal hin und her überlegt und finde die Argumente von der Diskussion im letzten Wettbewerb doch sehr einleuchtend. Ich habe deine Idee sinngemäß übernommen: Eine Ausnahme dieser Einschränkungen ist möglich, wenn aus den Belegangaben hervorgeht, dass die Texte von unterschiedlichen Autoren stammen (zum Beispiel bei Sammelwerken). --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 20:49, 9. Feb. 2013 (CET)
Wenn wir verschiedene "Autoren" zulassen, dann würden mehrere Zeitungsartikel zählen, wenn sie von verschiedenen Journalisten stammen, aber nicht, wenn sie derselbe Journalist selbst im Abstand von Jahren geschrieben hat. Wieso jetzt plötzlich wieder Autoren? Dieselbe Zeitung = 1 Link, mehrere Zeitung über ein Nachrichtenarchiv = mehrere Links. Ebenso Bücher. Sonst können wir uns gleich wieder in Diskussionen und Regeleierei verzetteln. -- Harro 10:05, 10. Feb. 2013 (CET)
Deinen Vorschlag verstehe ich nicht so ganz. Ich finde die Autorenregel von der Logik her sehr einleuchtend und auch relativ einfach handhabbar. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 12:22, 10. Feb. 2013 (CET)
Wenn ein oder mehrere Autoren gemeinsam ein Buch schreiben ist das eine Quelle, wenn mehrere Autoren kapitelweise ein Buch schreiben, dann sind das mehrere Quellen. Wenn ein Journalist mehrere Zeitungsartikel beim selben Blatt schreibt, dann ist das nur eine Quelle, wenn mehrere Journalisten schreiben, dann sind das mehrere Quellen. Das ist weder einleuchtend noch einfach nachvollziehbar, weil oft nur die Zeitung, aber nicht der Schreiber angegeben wird. Man müsste also erst nachsehen ... und nicht immer werden die namentlich genannt. Das gibt lauter neue Fragen und Diskussionsbedarf. Oben hatten wir das einfach nach der Domain entschieden und bei Google bzw. allgemein bei Archivsites eine Ausnahme gemacht, weil ein Archivlink quasi einer Weiterleitung auf eine Domain entspricht. Das ist einfach zu entscheiden und ich sehe jetzt nicht, warum wir das verkomplizieren müssten. -- Harro 23:40, 10. Feb. 2013 (CET)

Doppelte Nennungen werden nicht berücksichtigt. Mehrfache Aufführungen der gleichen Literaturangabe, auch wenn unterschiedliche Seiten genannt werden, werden in der Zählung zu einem Beleg zusammengefasst. Ebenso gelten mehrere Webseiten, die der gleichen Domain angehören, als nur ein Beleg. Eine Ausnahme dieser Einschränkung ist in Bezug auf Archive möglich, wenn auf verschiedene Werke verwiesen wird. Sieht so dein Vorschlag aus? --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 12:01, 11. Feb. 2013 (CET)

Ich persönlich sehe nur Einzelnachweise als Belege an und würde auch nur diese zählen. Wenn ein Weblink bestimmte Fakten belegt, dann sollte man ihn auch entsprechend formatieren, sonst fliegt er womöglich später raus, wenn er "tot" ist oder es zu viele Weblinks werden. Auch eine Literaturangabe, auf die kein Bezug genommen wird, macht wenig Sinn, zumindest nicht, wenn man "Belege" zählen will. Was die Wertung der Einzelnachweise betrifft: ich finde, Literaturbelege mit unterschiedlicher Seitenzahl sollten auf jeden Fall voll zählen. Diese Art der Recherche ist ebenso aufwändig wie wünschenswert, daher sollte man sie fördern. Ich würde da keine Höchstgrenze setzen, denn der Aufwand steigt ja weiter an, je mehr Seiten man lesen muss. Bei Webbelegen mag es eher "Missbrauchsmöglichkeiten" geben, da könnte man ein Limit (z.B. 5 pro Domain) vorgeben. Dass Schiris die Zählung übernehmen, wäre ok für mich, aber auch für die braucht man ja klare Regeln.--Berita (Diskussion) 12:24, 11. Feb. 2013 (CET)

Als Belege haben wir immer - also schon seit Beginn des Wettbewerbs - sowohl Einzelnachweise als auch Literatur und Weblinks gezählt. Hier kommt es, würde ich sagen, auf die individuelle handwerkliche Umsetzung an, ob man eher mit vielen Referenzen, dafür aber weniger allgemeine Literatur- und Weblinkangaben oder andersrum arbeitet. Ich sehe keinen Anlass, das zu verändern, zumal Belege fehlen nicht immer nur durch Referenzen abgearbeitet wird und das muss man ja auch mitwerten. Dein zweiter Vorschlag geht in Richtung meines ersten Vorschlags, aber wie sich oben gezeigt hat, gibt es da auch Gegenargumente gegen. Ich halte alle drei bisher diskutierten Möglichkeiten für durchführbar, jetzt müssen wir uns nur noch für eine entscheiden. Mich persönlich hat nun doch Harros Idee am ehesten überzeugt. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 12:34, 11. Feb. 2013 (CET)
+1 für den Ansatz, Printquellen (und GoogleBooks?) besser zu bewerten. --Flominator 16:14, 11. Feb. 2013 (CET)
sprich Harros Vorschlag? --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 17:04, 11. Feb. 2013 (CET)
Nein, zweite Hölfte von Berita. --Flominator 17:48, 11. Feb. 2013 (CET)
Mist ;-) Wie gesagt, ich kann mich mit allen Vorschlägen arrangieren, wobei ich Harros favorisiere. Steht 2:2. Pattsituation. Fünfte Meinung? --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 17:53, 11. Feb. 2013 (CET)
Ich habe ja oben das Chartbeispiel genannt, wenn ich statt der Übersichtsseite mit allen Informationen fünf Einzelseiten bekomme, dann dient das nicht dem Leser und ist reine Punkteschinderei. Wer mehrere Seiten lesen muss, um etwas zu belegen, der kann dann außerdem auch bestimmt den Artikel ausbauen und das bringt mehr Punkte und mehr Information für den Leser. Gerecht bringt man es eh nicht hin, ohne Regelwust zumindest, dann aber lieber weniger Links. - Harro 22:43, 11. Feb. 2013 (CET)
Ist es nicht eigentlich ganz einfach? Der Beleg ist das Buch, nicht der Google Link. Auch wenn es für ein Buch einen Google-Books-Link gibt. Genauso sollte eine Ausgabe einer Zeitschrift / Zeitung für sich genommen als eine Quelle gesehen werden. Also die FAZ vom 20. Januar und die vom 7. August sind zwei Belege. Ausnehmen könnte man davon Kolumnen, Blogs o.ä. So etwas leuchtet doch eigentlich jedem ein.--Emergency doc (Disk)RM 00:31, 12. Feb. 2013 (CET)

Also. Ich finde, wir haben mehrere sinnvolle Ideen. Jetzt müssen wir uns nur noch entscheiden. Soweit ich das sehe, haben sich drei Möglichkeiten herauskristallisiert:

  1. Doppelte Nennungen werden nicht berücksichtigt. Mehrfache Aufführungen der gleichen Literaturangabe, auch wenn unterschiedliche Seiten genannt werden, werden in der Zählung zu einem Beleg zusammengefasst. Ebenso gelten mehrere Webseiten, die der gleichen Domain angehören, als nur ein Beleg. Eine Ausnahme dieser Einschränkung ist in Bezug auf Archive möglich, wenn auf verschiedene Werke verwiesen wird.
  2. Doppelte Nennungen werden nicht berücksichtigt. Mehrere Webseiten, die der gleichen Domain angehören, gelten als nur ein Beleg. Ebenso werden mehrfache Aufführungen der gleichen Literaturangabe, auch wenn unterschiedliche Seiten genannt werden, in der Zählung zu einem Beleg zusammengefasst. Eine Ausnahme dieser Einschränkungen ist möglich, wenn aus den Belegangaben hervorgeht, dass die Texte von unterschiedlichen Autoren stammen (zum Beispiel bei Sammelwerken).
  3. Doppelte Nennungen werden nicht berücksichtigt. Mehrere Webseiten, die der gleichen Domain angehören, zählen. Ebenso fließen mehrfache Aufführungen der gleichen Literaturangabe, wenn unterschiedliche Seiten genannt werden, in die Zählung ein.

1,2 oder 3? Ob ihr wirklich richtig steht, seht ihr wenn das Licht angeht. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 16:43, 16. Feb. 2013 (CET)

Ich bin für 3. Darf ich mir jetzt 'nen Ball nehmen? ;) -- Gruß  Sir Gawain Disk. 19:50, 18. Feb. 2013 (CET)
Gnnnnein, 3. auf gar keinen Fall. Und ich schreibe jetzt nicht zum dritten Mal, warum nicht. Ob 1. oder 2. könnte ich besser sagen, wenn ich es verstehen würde. Ich würde mehr bei Emergency doc bleiben:
  • "Als Quellen zählen einzelne Ausgaben von Zeitungen, Zeitschriften, Büchern etc. Auch Webinhalte und Webdatenbanken können als Beleg angegeben werden (siehe aber WP:Belege). Jede Ausgabe und jede Website zählt nur als ein Nachweis, verschiedene Seiten bzw. Unterseiten werden nicht mehrfach gewertet. Verschiedene Websites/Werke, die in Webarchiven, Google Books und Ähnlichem abgelegt sind, zählen als eigenständige Verweise."
Ist das verständlich und möglichst eindeutig? Das ist zumindest für mich das Ergebnis der obigen Diskussion. Natürlich gibt es Härtefälle. Vielleicht muss man das beim nächsten Mal wieder erweitern. Aber jetzt wäre es einfach, praktikabel und außerdem weiß jeder, worauf er sich einlässt, wenn es so festgeschrieben ist. -- Harro 21:28, 18. Feb. 2013 (CET)
Das ist nach meinem Verständnis Idee 1 (die ich auf deinen obigen Beitrag hin so formuliert habe), nur etwas verklausulierter. ;-) --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 22:21, 18. Feb. 2013 (CET)

Ich habe mal versucht, die verschiedenen Positionen auszuwerten. Wenn sich jemand falsch zugeordnet wird, bitte meckern! Nach meiner Auswertung deutet sich ein Kopf-an-Kopf-Rennen zwischen den Vorschlägen 1) und 3) an. Für 1) plädieren, wenn ich das richtig sehe, Harro, Killikalli und Emergency doc. Für 3) Berita, Flominator und Sir Gawain. Ich bin noch zwischen den Vorschlägen hin- und hergerissen, sehe Vor- und Nachteile bei beiden Varianten. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 11:50, 19. Feb. 2013 (CET)

Wawewewi

Benutzer_Diskussion:Flominator/WaWeWeWi.js --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 17:13, 14. Dez. 2012 (CET)

Miniverbesserungen

Bewertung mehrerer Koordinaten/defekte Weblinks besser dokumentieren. Bewertung ab der zweiten Miniverbesserung (0.25) war beim letzten Wettbewerb unklar. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 17:13, 14. Dez. 2012 (CET)

Bot für Zwischenergebnisse beauftragen

Anfrage gestellt --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 17:13, 14. Dez. 2012 (CET)

Redundanzen

Erklärung, wie Verbesserungen gewertet werden, die sich über mehrere Artikel erstrecken (Redundanzen) --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 17:13, 14. Dez. 2012 (CET)

Hast Du schon eine Idee?--Emergency doc (Diskussion)≤≤RM≥≥ 18:00, 18. Jan. 2013 (CET)
Man muss die mangelhaften Versionen aller beteiligten Artikel in das erste Feld von Wawewewi einfügen, alle verbesserten Versionen in das zweite Feld. Ich schlage allerdings vor, solche Fälle wegen Kompliziertheit an den A-Schri abzutreten. --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 18:05, 18. Jan. 2013 (CET)

Überarbeitungen von Listen

Wenn wir WaWeWeWi wirklich dazu bringen, Tabellen zu ignorieren, sollten es dennoch irgendwie honoriert werden, wenn größere Listen aktualisiert oder belegt werden. --Flominator 11:35, 20. Jan. 2013 (CET)

Sorry, das ging irgendwie an mir vorbei. Was ist denn das Problem mit Tabellen? Warum sollen sie ignoriert werden?--Emergency doc (Diskussion)≤≤RM≥≥ 11:08, 25. Jan. 2013 (CET)
siehe Benutzer Diskussion:Flominator/WaWeWeWi.js#Herausrechnen von Tabellenzeilen --Flominator 15:34, 3. Feb. 2013 (CET)
Ich komme grad gedanklich nicht ganz mit. Es werden doch nur Tabellenzeichen herausgerechnet und nicht die Inhalte der Tabellen/Listen, oder? --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 18:12, 4. Feb. 2013 (CET)
Allerdings ist das Überarbeiten von Tabellen auch eine gewisse Arbeit, die man nicht unberücksichtigt lassen sollte. ggf. wäre eine pauschale Wertung z.B. mit dem Faktor 0.5 sinnvoll, um Tabellen nicht ganz aussen vor zu lassen, aber reine Artikelarbeit eben doch höher zu bewerten.--Emergency doc (Disk)RM 21:12, 4. Feb. 2013 (CET)
Das stimmt, komplexere Tabellen erfordern sogar eine ganze Menge Arbeit. Grüße LZ6387 Disk. Bewertung 21:47, 4. Feb. 2013 (CET)
Schaut euch einfach mal unter Benutzer Diskussion:Flominator/WaWeWeWi.js#Herausrechnen von Tabellenzeilen den aktuellen Vorschlag an und äußert euch dort. --Flominator 08:14, 6. Feb. 2013 (CET)
Archivierung dieses Abschnittes wurde gewünscht von: --Nikkis Diskutiere mit mir!Schreib mir ins Gästebuch! 18:18, 14. Mär. 2013 (CET)