Punktbiseriale Korrelation

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen

Als punktbiseriale Korrelation wird der Korrelationskoeffizient für den Zusammenhang zwischen einem intervallskalierten Merkmal und einem dichotomen (bernoulliverteilten) Merkmal bezeichnet. Es handelt sich nicht um eine eigenständige Maßzahl, sondern um einen Spezialfall des gewöhnlichen Korrelationskoeffizienten nach Pearson, der in diesem Fall berechnet werden kann als

,

wobei die Quadratsumme, den Stichprobenumfang, den Anteil der Untersuchungseinheiten mit der in D erfassten Eigenschaft und den Anteil der Untersuchungseinheiten ohne die in D erfasste Eigenschaft bezeichnet.

Herleitung aus der Pearson-Korrelation[Bearbeiten | Quelltext bearbeiten]

Der Einfachheit halber wird angenommen, dass das dichotome Merkmal die Werte 0 und 1 annimmt, sodass der Mittelwert in gleich ist. Nach der allgemeinen Formel berechnet sich die Korrelation zwischen und über

.

Man kann nun eine Fallunterscheidung treffen: Untersuchungseinheiten sind D=1 und liegen mit über dem Mittelwert in D, die übrigen Untersuchungseinheiten sind D=0 und liegen mit unter dem Mittelwert in D. Damit gilt

,

was sich über

zur obigen Gleichung vereinfachen lässt.

Anwendung in gängiger Statistiksoftware[Bearbeiten | Quelltext bearbeiten]

SPSS und R verwenden automatisch die punktbiseriale Rechenweise, wenn die Befehle CORRELATE bzw. cor, cor.test angefordert werden und eine der Variablen nur zwei Ausprägungen (z. B. die Werte 0 und 1) hat, die auch als berechnungsrelevant angesehen werden (−7 oder 99 z. B. können in SPSS als fehlende Werte markiert und somit ignoriert werden).

Literatur[Bearbeiten | Quelltext bearbeiten]

  • Jürgen Bortz: Statistik für Human- und Sozialwissenschaftler. 6. Auflage. Springer, Berlin u. a. 2005, ISBN 3-540-21271-X.
  • J. Cohen, P. Cohen, S. G. West, L. S. Aiken: Applied Multiple Regression / Correlation Analysis For The Behavioral Sciences. London 2003, ISBN 0-8058-2223-2.