Zitationsanalyse

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Die Zitatenanalyse ist ein Gebiet der Bibliometrie, das sich mit dem Studium von Zitationen, das heißt den Beziehungen zwischen zitierten und zitierenden Arbeiten, und ihrer Anwendung als bibliometrische Untersuchungsmethode beschäftigt.

Als bibliometrischen Parameter kommen verschiedene Indikatoren zum Einsatz, die meistens mit Hilfe von statistischen Methoden errechnet werden, wobei bestimmte Annahmen bezüglich des Zitierverhaltens von Autoren gemacht werden:

  • Im Allgemeinen gilt eine wissenschaftliche Arbeit als einflussreich, wenn sie von anderen Autoren oft zitiert wird. Als Indikator verwendet man hier den Zitationswert, der Zitationshäufigkeiten in Relation zur Gesamtzahl der zitierten Beiträge setzt, wobei auch seine zeitliche Entwicklung berücksicht werden kann.
  • Unterstellt man eine Beziehung zwischen mehreren Arbeiten, die gemeinsam zitiert werden oder gemeinsam eine andere zitieren, so kann man mit Hilfe der Clusteranalyse Gruppen von Autoren und/oder Publikationen bilden, die sich möglicherweise mit einem Teilgebiet der Wissenschaft beschäftigen.
  • Falls die Möglichkeit der inhaltlichen Auswertung von Publikation besteht, dann stellt die Korrespondenzanalyse ein geeignetes Werkzeug für die Erstellung von Wissenschaftslandkarten dar.
Ergebnis der Zitationsanalyse: Publikationen zum Thema Outsourcing

Weil der Aufbau wissenschaftlicher Publikationen weitgehend standardisiert ist und neben Referenzen andere Daten wie Abstracts, Fulltext, Deskriptoren und Anschriften der Autoren enthalten, kommt die Zitationsanalyse immer häufiger zum Einsatz. Zur Recherche und Analyse von Zitationen gibt es Zitationsdatenbanken, die erforderliche Informationen im offenen Format bereitstellen. Da sich die Ergebnisse von Zitationsanalysen oft nicht in einfachen Zahlen ausdrücken lassen, werden auch Methoden der Informationsvisualisierung eingesetzt, um die komplexen Zitationsbeziehungen abzubilden.

Ziele der Zitationsanalyse sind

  • inhaltlich-fachliche Beziehungen zwischen Personen, Institutionen, Publikationen, Disziplinen und deren wissenschaftlichen Einfluss (Impact)[1]
  • Forschungsschwerpunkte von wissenschaftlichen Arbeiten und ihre Entwicklung über die Zeit
  • Aktivitäten und Aktualität von Forschungsgruppen innerhalb der Wissenschaften sowie „heiße“ Themen und Diskussionen
  • bahnbrechende Publikationen, die Grundlage für weitere Forschungen bilden.
  • Beziehungen zwischen Forschung und Wirtschaft (Zitate wissenschaftlicher Literatur in Patenten)
  • Einsatz als Evaluierungsinstrument für Peer Reviews
  • Teilaspekt zur Beurteilung der Qualität wissenschaftlicher Arbeit als Entscheidungsgrundlage für öffentliche Forschungseinrichtungen

Geschichte[Bearbeiten]

Dieser Artikel oder Abschnitt besteht hauptsächlich aus Listen, an deren Stelle besser Fließtext stehen sollte. Bitte hilf Wikipedia, das zu verbessern. Mehr zum Thema ist hier zu finden.
  • 1927 Gross & Gross
  • 1955 „Citation indexes for science“ (Eugene Garfield)
  • 1963 Science Citation Index
  • 1963 Journal Impact Factor (E. Garfield & Irving H. Sher)
  • 1966 Co-citation (Rosengren)
  • 1968 Matthäus-Effekt (Robert K. Merton)
  • 1969 „Bibliometrie“ (A. Pritchard)
  • 1973 Social Sciences Citation Index
  • 1973 Co-citation analysis (Henry Small & Irina Marshakova)
  • 1976 Journal Citation Reports
  • 1978 „Scientometrics“
  • 1978 Arts & Humanities Citation Index
  • 1985 Citer motivations (Terrence Brooks)
  • 1988 CSTPC – CSCD (Beijing, China)

Zitationsgraphen[Bearbeiten]

Eine Menge von Zitationen und dazugehörigen Publikationen lassen sich mathematisch als Graph beschreiben, der dann als Zitationsgraph (auch Citespace) bezeichnet wird. Zur Analyse kommen unter Anderem Methoden der Netzwerkanalyse zum Einsatz. In den Zitationsgraphen bilden Publikationen (in der Regel wissenschaftliche Fachartikel) Knoten, zwischen denen Zitationen die Kanten aufspannen. Alternativ lassen sich auch alle Artikel einer Fachzeitschrift zu einem Knoten zusammenfassen, um verschiedene Zeitschriften zu vergleichen. Weitere Möglichkeiten zur Konstruktion von Graphen aus Zitierungsdaten sind Informationen zur Koautorschaft und Kozitation. Die wichtigsten auf Zitation beruhenden Beziehungen zwischen zwei Publikationen A und B sind:

Möglichkeiten des Zitierens
  • Zitation: Ein Artikel A zitiert einen Artikel B
  • Kozitation: Zwei Artikel A und B werden von einem Artikel C gemeinsam zitiert
  • Bibliografische Kopplung: Zwei Artikel A und B zitieren einen gemeinsamen Artikel C

Aus Untersuchungen von Zitationsgraphen lassen sich verschiedene Regelmäßigkeiten und Strukturen über das Publikationsverhalten von Autoren ablesen. Es zeigt sich, dass Zitationsgraphen skalenfreie und Kleine-Welt-Netzwerke bilden. Durch Clusteranalyse und anderen Techniken der Netzwerkanalyse können Communities von sich oft gegenseitig zitierenden Forschern gefunden werden.

In der Webometrie werden analog zum Zitationsgraphen Verlinkungsgraphen von Webseiten und Hyperlinks (Sitationen) untersucht.

Fehlerquellen[Bearbeiten]

Die Ergebnisse der Zitationsanalyse können durch verfälschte Indikatoren wie zum Beispiel die Publikationsrate von Autoren verzerrt werden. So werden Autoren mit großer Anzahl an Publikation zwar öfter zitiert, was sich in der Statistik niederschlägt, dies muss aber nicht bedeuten, dass sie oder ihre Beiträge bedeutender sind als andere. Manche Autoren veröffentlichen das gleiche wissenschaftliche Ergebnis mehrmals unter anderen Titeln oder in verschiedenen Sprachen.

Statistische Artefakte entstehen dadurch, dass bei Publikationen mit mehreren Verfassern nicht alle Autoren berücksichtigt werden. Auch die Gewichtung der einzelnen Autoren nach Arbeitsanteil kann in der Analyse kaum verwertet werden, da die Autorennamen oft aus technischen Gründen alphabetisch gespeichert werden. Auch Tipp- und Transkriptionsfehler, die bei der Erfassung von Namen in heterogenen Zeichensatzsystemen entstehen, fallen in diese Kategorie.

Unvergleichbare Vergleiche entstehen dann, falls zum Beispiel Rangordnungen bei Zeitschriften erstellt werden, die vorhandene Informationen wie Verlagszyklen, Publikationsrate vernachlässigen. Auch Zitate von Review-Artikeln, die lediglich einen Überblick bieten, können ohne inhaltliche Auswertung durch statistische Automatismen kaum gefiltert werden.

Unzulässige Verwendung mathematischer oder statistischer Verfahren, deren Voraussetzungen nicht erfüllt oder verletzt werden, ohne entsprechende Korrekturen vorzunehmen, führt zu Ineffizienzen. Diese können eine zu geringe Anzahl an Dokumenten sein wie im Falle der Multidimensionaler Skalierung oder das Fehlen einer Normalverteilung bzw. eine unzulässige Datenunabhängigkeit bei Regressionsanalyse.

Zitieren von eigenen Werken bzw. aus Gefälligkeitsgründen gilt zwar als unseriös, ob allerdings sachliche oder eher strategische Gründe vorliegen, lässt sich oft nur schwer feststellen.

Nicht berücksichtigte Unterschiede in der Art des Referenzierens bei verschiedenen Disziplinen.

Problematik[Bearbeiten]

Da davon ausgegangen wird, dass gute Arbeiten häufiger zitiert werden, wird die Anzahl der Zitationen, die ein wissenschaftlicher Beitrag erfährt, oft als Maß für seine Qualität verwendet. Diese gängige Praxis ist jedoch nicht unproblematisch, da manchmal die inhaltliche Bewertung vernachlässigt zu werden droht und rein statistische Kriterien den Ausschlag geben. Die Tatsache, dass ein bestimmter Autor oft zitiert wird, kann unterschiedlichste Gründe haben und erlaubt nicht in jedem Fall eine Aussage über die Güte seines Beitrags. Auch kann es zur Bildung so genannter Zitierzirkel kommen („Zitierst du mich, zitier’ ich dich“), die das Ergebnis verfälschen (boshafterer Name: Zitierkartell).

Konkrete Kritikpunkte von Zitationsanalysen

  • Der durch die Anzahl der Zitationen in wissenschaftlichen Aufsätzen gemessene Impact einer Arbeit ignoriert den Einfluss, den eine Arbeit möglicherweise in anderen Bereichen hat (zum Beispiel in der Industrie, die ihre Ergebnisse nicht publiziert)
  • Durch den Matthäus-Effekt werden häufig zitierte Arbeiten ohne Blick auf den Inhalt wiederum häufiger zitiert. Eine Studie von M. V. Simikin und V. P. Roychowdhury[2] deutet darauf hin, dass nur rund ein Viertel der zitierten Arbeiten von den Autoren überhaupt gelesen werden
  • Manche Zitationen werden lediglich hinzugefügt, um den Impact Factor eines Autors oder eines Journals zu steigern. Auch Publikationen werden dahingehend optimiert, eine hohe Zahl von Zitationen zu erreichen, anstatt die Qualität zu optimieren.
  • Die Bedeutung von Artikeln in Fachzeitschriften und Proceedings und Monographien variiert je nach Fachgebiet deutlich. In Zitationsdatenbanken werden diese Unterschiede nicht berücksichtigt, so dass einzelne Fachgebiete unter- oder überbewertet werden.
  • Bei den meistzitierten Arbeiten handelt es sich oft um Ausnahmen, die vor allem zitiert werden, weil es üblich ist, diese Arbeiten zu zitieren. Andere Arbeiten mit ebenso großem Einfluss werden dagegen nicht mehr explizit zitiert, weil ihre Inhalte selbstverständlich geworden sind.
  • Die Berechnung des Impact-Faktors erfolgt immer zeitbezogen mit einer Frist von maximal 6 bis 8 Jahren (zwei PhD-Perioden), wobei im Schnitt nach den ersten zwei Jahren der Zitationspeak erreicht wird. Je nach Aktivität des Forschungsgebiets kann dieser Wert jedoch stark variieren, was zu Fehlern in der Berechnung des Impact Factors und Halbwertszeit der Zitationshäufigkeit führen kann. Ähnliche Fehler können entstehen, wenn die Periodik der Publikationsorgane unberücksichtigt bleibt.
  • Durch unterschiedliche Zitierweisen werden einzelne Arbeiten in Zitationsdatenbanken als unterschiedliche Veröffentlichungen behandelt. So wurde beispielsweise das berühmte Paper Initial sequencing and analysis of the human genome des Humangenomprojekts von 2001 im ISI zunächst mit unterschiedlichen Autoren aufgeführt, wodurch es nicht unter den meistzitierten Arbeiten auftauchte.
  • Manche nichtenglischsprachigen Fachzeitschriften erscheinen zusätzlich in einer englischen Ausgabe. Diese wird jedoch fälschlicherweise oft als eigenständige Zeitschrift gezählt.

Science Impact Index[Bearbeiten]

Trotz der sicherlich berechtigten Kritik an einzelnen Zitationen hat sich der Science Impact Index (SII) als Maß für die Forschungsqualität eines Wissenschaftlers als wertvolle objektive Orientierungshilfe erwiesen. Der SII ist eine Zitationsrate. Sie entspricht der Anzahl der Wissenschaftler, welche die Arbeiten eines Autors innerhalb eines Jahres in einer Zeitschrift mit Impact-Faktor (IF) zitieren. Dabei werden auch Bücher, Buchbeiträge und Veröffentlichungen in Zeitschriften ohne IF erfasst, dann nämlich, wenn sie in IF-Zeitschriften zitiert werden. Zumindest in naturwissenschaftlichen und medizinischen Fachgebieten lässt der SII bei Wissenschaftlern, die schon wenigstens sieben Jahre lang Möglichkeiten zum Forschen hatten, eine so verlässliche Positionsbestimmung unter Fachkollegen und eine so stabile Vorhersage über die folgenden Jahre zu, wie sie durch andere Maße und Gutachter bisher nicht erreicht werden.

Siehe auch[Bearbeiten]

Literatur[Bearbeiten]

Monographien[Bearbeiten]

  • E. Garfield: Citation Indexing - Its Theory and Application in Science, Technology, and Humanities. Wiley, New York 1979, ISBN 978-0-471-02559-7.
  • O. Nacke: Zitatenanalyse und verwandte Verfahren. IDIS, Bielefeld 1980, ISBN 978-3-88139-024-8.
  • I.V. Marshakova: Sistema citirovaniya nauchnoi literatury kak sredstvo slezheniya za razvitiem nauki. Nauka, Moskva 1988, ISBN 5-02-013311-6.
  • Henk F. Moed: Citation Analysis in Research Evaluation. Springer Netherlands, Dordrecht 2005, ISBN 1-4020-3713-9.[1]

Einzeldarstellungen[Bearbeiten]

  • H. Small: Co-citation in the scientific literature: A new measure of the relationship between two documents. In: J. Amer. Soc. Inform. Sci., Bd. 24, Nr. 4, 1973, S. 265-269.
  • H. Small, E. Sweeney: Clustering the Science Citation Index using co-citations. I. A comparison of methods. In: Scientometrics, Bd. 7, Nr. 3-6, 1985, S. 391-409.
  • H. Small, E. Sweeney, E. Greenlee: Clustering the Science Citation Index using co-citations. II. Mapping science. In: Scientometrics, Bd. 8, Nr. 5-6, 1985, S. 321-340.
  • P. Ball: Index aims for fair ranking of scientists. In: Nature, Bd. 436, Nr. 7053, 2005, S. 900.
  • J. E. Hirsch: „An index to quantify an individual’s scientific research output“. In: Proc.Nat.Acad.Sci. Bd. 102, Nr. 16569, 2005.
  • Gross, P. L. K. & Gross, E. M.: College libraries and chemical education. In: Science, Bd. 66, 1927, S.385-389.
  • Pritchard, Alan: Statistical Bibliography or Bibliometrics?. In: Journal of Documentation, London, Bd. 25, Nr. 4, 1969, S.348-349.
  • J. Rauter: „Zitationsanalyse und Intertextualität. Intertextuelle Zitationsanalyse und zitatenanalystische Intertextualität“ Kovac (2006).

Weblinks[Bearbeiten]

Quellen[Bearbeiten]

  1. O. Nacke: Zitatenanalyse und verwandte Verfahren. IDIS, Bielefeld 1980, ISBN 978-3-88139-024-8.
  2. M.V. Simkin, V.P. Roychowdhury, Read before you cite! Complex Systems 14 (2003) 269–274, http://arxiv.org/abs/cond-mat/0212043.