Glicko-System

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Das Glicko-System ist ein von Mark E. Glickman entwickeltes Wertungssystem, das wie das Elo-System erlaubt, die Spielstärke, etwa von Schachspielern, zu messen. Die Besonderheit des Systems liegt in der Einführung einer weiteren Größe, der RD (ratings deviation). Das Glicko-System, wie auch die Weiterentwicklung Glicko-2, ist lizenzfrei und daher besonders bei Online-Spielseiten zu finden. Die Formeln sind auf der Webseite von Mark E. Glickman angegeben.

Unterschiede zum Elo-System[Bearbeiten | Quelltext bearbeiten]

Als Erweiterung zum Elo-System führt Glickman die Variable RD (ratings deviation) ein. Diese schätzt ab, wie genau die aktuelle Wertungszahl mit der tatsächlichen (aber unbekannten) Spielstärke übereinstimmt. Mit einer Wahrscheinlichkeit von 67 % liegt die tatsächliche Spielstärke im Bereich von ±RD der Wertungszahl, mit 95 % im Bereich von ±2 RD. Hat ein Spieler etwa eine Wertungszahl von 1500 und einen RD von 50, so soll seine tatsächliche Spielstärke mit einer Wahrscheinlichkeit von 95 % im Bereich von 1400 bis 1600 liegen. Wenn ein Spieler spielt, sinkt sein RD, da seine Wertungszahl mit jedem Spiel genauer wird. Spielt er nicht, steigt diese wieder langsam über die Zeit an. Außerdem bewirkt ein hoher RD, dass sich seine Wertungszahl in größeren Intervallen ändert.

Dank der Einführung der RD wird auch sichergestellt, dass sich die Wertungszahl eines aktiven Spielers, der gegen einen neuen oder inaktiven Spieler spielt, nur geringfügig ändert. Dies ist sinnvoll, da die Stärke des neuen oder inaktiven Spielers nicht genau genug bekannt ist und das Resultat daher nicht viel über die Stärke des aktiven Spielers aussagt.

Berechnung[Bearbeiten | Quelltext bearbeiten]

Anmerkung: Diese Schritte gelten nur für das ursprüngliche Glicko-System und nicht für die Erweiterung Glicko-2.

Wenn der Spieler noch nicht bewertet ist wird die Spielstärke üblicherweise auf 1500 und der RD auf 350 gesetzt.

Schritt 1: Bestimmung eines vorläufigen RD[Bearbeiten | Quelltext bearbeiten]

Der vorläufige RD-Wert () wird, ausgehend vom alten RD-Wert () wie folgt berechnet:

Dabei ist die Zeit (in Wertungsperioden) seit dem letzten Wettkampf und '350' ist der Standardwert für einen unbewerteten Spieler. Sollten mehrere Spiele in einer Periode stattfinden werden sie behandelt als ob sie gleichzeitig stattgefunden haben. Die Wertungsperiode kann sehr lang (mehrere Monate) oder sehr kurz (einige Minuten) sein, abhängig davon wie häufig Spiele ausgetragen werden. Die Konstante ist abhängig von der Unsicherheit über die Stärke eines Spielers nach Ablauf einer gewissen Zeit. Sie kann aus einer genauen Analyse der vorliegenden Daten abgeleitet werden. Alternativ kann Sie geschätzt werden auf Basis der Zeit die vergehen würde bis der RD eines Spielers gleich dem eines unbewerteten Spielers wäre. Angenommen es dauert 100 Wertungsperioden bis der RD eines Spielers den eines unbewerteten Spielers (350) erreicht und ein typischer Spieler hat einen RD von 50, dann kann die Konstante durch auflösen der Gleichung

nach [1] gefunden werden:

Schritt 2: Bestimmung der neuen Spielstärke[Bearbeiten | Quelltext bearbeiten]

Die neue Wertung r, nach einer Anzahl von m Spielen, ergibt sich aus folgender Gleichung:

wobei:

  • die alte Wertung des Spielers ist,
  • für das Ergebnis des Spieles i (1 für einen Sieg, 0,5 für ein Unentschieden und 0 für eine Niederlage) ist
  • der Erwartungswert für einen Sieg im Spiel i,
  • ein konstanter Gewichtungsfaktor ist, der lediglich von dem RD des Gegners im Spiel i abhängt, und

Weiter gilt:

wobei:

  • die alte Wertung des Spielers ist,
  • die Wertung des jeweiligen Gegners im Spiel i repräsentiert.

Schritt 3: Bestimmung des neuen RD[Bearbeiten | Quelltext bearbeiten]

Der Zweck der Berechnung in Schritt 1 war die Anpassung (Erhöhung) des RD an die erhöhte Unsicherheit über die Spielstärke eines Spielers nach einer Zeit der Nicht-Anwendung des Modells.

Nun wird der neue RD unter Berücksichtigung der aktuellen Spiele neu justiert (und typischerweise reduziert):

Glicko-2[Bearbeiten | Quelltext bearbeiten]

Das Glicko-2-System führt zusätzlich zum RD auch noch eine rating volatility ein. Je konstanter der Spieler spielt, desto geringer ist diese.

Der Schachserver Lichess verwendet das Glicko-2-System zur Bewertung der Spiele in verschiedenen Schachvarianten und Bedenkzeiten.

Weblinks[Bearbeiten | Quelltext bearbeiten]

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

  1. http://www.glicko.net/glicko.html