Matching (Statistik)

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Racine carrée bleue.svg
Dieser Artikel wurde auf der Qualitätssicherungsseite des Portals Mathematik eingetragen. Dies geschieht, um die Qualität der Artikel aus dem Themengebiet Mathematik auf ein akzeptables Niveau zu bringen.

Bitte hilf mit, die Mängel dieses Artikels zu beseitigen, und beteilige dich bitte an der Diskussion! (Artikel eintragen)

Matching in der Statistik bezeichnet Methoden, mit dem "ähnliche" Beobachtungen in zwei oder mehr Datensätzen verbunden werden. Mit den Matching-Methoden wird den Beobachtungen aus einem Datensatz eine oder mehrere "ähnliche" Beobachtungen anhand der gemeinsamen Merkmale zugeordnet. Damit wird eine gemeinsame Analyse der Daten möglich, obwohl es vermutlich keinen Fall gibt, der in beiden Datensätzen tatsächlich vorkommt.

Beispiel[Bearbeiten]

Z.B. hat man zwei Datensätze: Ergebnisse einer Befragung zur Einkommenssituation und einer anderen Befragung zu Lebensbedingungen. Die Befragten in beiden Datensätzen sind zwar verschieden, aber es sind bei beiden Befragungen gemeinsame Merkmale (z. B. Geschlecht, Altersgruppe, Wohnort usw.) erfasst worden. Mit den Matching-Methoden wird den Beobachtungen aus einem Datensatz eine oder mehrere "ähnliche" Beobachtungen anhand der gemeinsamen Merkmale zugeordnet. Damit wird eine gemeinsame Analyse von Einkommenssituation und Lebensbedingungen möglich, obwohl es vermutlich keine Befragten gibt, die an beiden Befragungen teilgenommen haben. Die Qualität der Analyse von Einkommenssituation und Lebensbedingungen hängt stark von der Qualität des Matchings ab.

Spezielle Matching-Verfahren[Bearbeiten]

Einzelne Matching-Verfahren sind

Medizinstatistik[Bearbeiten]

Matching ist eine Methode, die beim Design von Beobachtungsstudien angewandt wird. Bei Fall-Kontroll-Studien können Fälle und Kontrollen so gewählt werden, dass sie in Bezug auf bestimmte Kriterien (z. B. Geschlecht, sozioökonomischer Status, Altersgruppe) übereinstimmen.[7] Dies ist auf individueller Ebene (für jeden Fall wird eine in dem/den gewählten Kriterien übereinstimmende Kontrolle ausgesucht) oder als Gruppen-Matching (frequency matching) möglich. Beim Gruppen-Matching wird die Zusammensetzung aller Kontrollen entsprechend der Zusammensetzung der Fälle gewählt. Wenn beispielsweise die Gruppe der Fälle zu 80 % aus Frauen besteht, wird die Kontrollgruppe mit einem ähnlichen Prozentsatz an Frauen zusammengestellt.[7]

Bei individuell gematchten Fall-Kontroll-Studien, die mittels logistischer Regression analysiert werden, sollte eine Sonderform dieser Methode (konditionale logistische Regression) angewandt werden. Wenn individuell nach mehreren Faktoren gematcht wird, besteht die Gefahr, dass für Fälle keine Kontrollen gefunden werden, die entsprechend der Matching-Kriterien übereinstimmen.

Einzelnachweise[Bearbeiten]

  1. Peikes, Deborah N., Lorenzo Moreno, and Sean Michael Orzol. "Propensity score matching." The American Statistician 62.3 (2008).
  2. Dehejia, Rajeev H., and Sadek Wahba. "Propensity score-matching methods for nonexperimental causal studies." Review of Economics and statistics 84.1 (2002): 151-161.
  3. Caliendo, Marco, and Sabine Kopeinig. "Some practical guidance for the implementation of propensity score matching." Journal of economic surveys 22.1 (2008): 31-72.
  4. Rubin, Donald B., and Neal Thomas. "Combining propensity score matching with additional adjustments for prognostic covariates." Journal of the American Statistical Association 95.450 (2000): 573-585.
  5. Erzberger, Christian, and Gerald Prein. "Optimal-Matching-Technik: Ein Analyseverfahren zur Vergleichbarkeit und Ordnung individuell differenter Lebensverläufe." (1997).
  6. Abbott, Andrew, and Angela Tsay. "Sequence analysis and optimal matching methods in sociology review and prospect." Sociological methods & research 29.1 (2000): 3-33.
  7. a b Weiß, Christel: Basiswissen Medizinische Statistik. 5. Auflage, 2010

Literatur[Bearbeiten]

  •  Susanne Rässler: Statistical Matching: A Frequentist Theory, Practical Applications and Alternative Bayesian Approaches. Springer, 13. Juni 2008, ISBN 978-0387955162.

Siehe auch[Bearbeiten]