Quantitative Linguistik

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche

Die Quantitative Linguistik (auch: Statistische Linguistik; engl. Quantitative Linguistics, Statistical Linguistics) ist eine Disziplin der Mathematischen Linguistik und damit der allgemeinen Linguistik bzw. Sprachwissenschaft insgesamt. Gegenstand der Quantitativen Linguistik sind Spracherwerb, Sprachwandel sowie Verwendung und Struktur von Sprachen. Sie untersucht Sprachen, deren Einheiten und Strukturen, mit den Mitteln der Kombinatorik, Wahrscheinlichkeitstheorie, Differenzen- und Differenzialgleichungen und testet die Ergebnisse mit Hilfe der Statistik;[1] ihre Aufgabe ist es, Sprachgesetze aufzustellen mit dem Ziel, eine exaktwissenschaftliche Theorie der Sprache zu entwickeln, die ein System miteinander verbundener Sprachgesetze bildet.[2] Einen solchen Verbund zusammenwirkender Sprachgesetze hat sich besonders die linguistische Synergetik von Anfang an zum Ziel gesetzt.

Die Quantitative Linguistik stützt sich auf Ergebnisse der Sprachstatistik, die man entweder als Statistik der Sprachen oder als Statistik beliebiger sprachlicher Gegenstände verstehen kann, ohne dass damit unbedingt weitergehende theoretische Ansprüche verbunden sind. Auch die Korpuslinguistik und die Computerlinguistik liefern wichtige Grundlagen.

Die Quantitative Linguistik reicht in ihren ersten Anfängen bis in die griechische und indische Antike zurück. Ein Traditionsstrang besteht in der Anwendung der Kombinatorik auf sprachliche Gegenstände;[3] ein weiterer beruht auf elementaren statistischen Erhebungen, auf die unter den Stichwörtern Kolometrie und Stichometrie verwiesen wird.[4]

Sprachgesetze in der Quantitativen Linguistik[Bearbeiten]

Unter Gesetz versteht die Quantitative Linguistik eine aus theoretischen Annahmen abgeleitete (deduzierte) Gesetzeshypothese, die mathematisch formuliert ist, mit anderen Gesetzen in Wechselbeziehung steht und hinreichend durch gezielte Untersuchungen überprüft und dabei nicht widerlegt wurde. Ein Gesetz muss für alle Sprachen gelten, in denen die entsprechenden Randbedingungen erfüllt sind. Zur Rolle von Gesetzen in der Quantitativen Linguistik führt Köhler aus: „Darüber hinaus kann man feststellen, dass diese Eigenschaften sprachlicher Elemente und ihre Zusammenhänge allgemeingültigen Gesetzen unterliegen, die sich streng mathematisch formulieren lassen in der Weise, wie wir es von den Naturwissenschaften her kennen. Dabei ist zu beachten, dass es sich um stochastische Gesetze handelt; sie sind nicht in jedem Einzelfall erfüllt (das ist weder notwendig noch möglich), sondern sie schreiben die Wahrscheinlichkeiten vor, mit denen bestimmte Ereignisse erfolgen bzw. bestimmte Verhältnisse in der Gesamtheit eintreten. Zu allen oben angeführten Beispielen wird man mit Leichtigkeit Gegenbeispiele finden, die als einzelne jedoch nicht gegen die entsprechenden Gesetze verstoßen, da Abweichungen vom statistischen Durchschnitt nicht nur zulässig, sondern sogar erforderlich und ihrerseits quantitativ exakt bestimmt sind. Im Grunde unterscheidet sich diese Situation nicht von der in den Naturwissenschaften, in denen die alten deterministischen Vorstellungen längst ausgedient haben und ebenfalls durch statistisch-probabilistische Modelle ersetzt wurden.“ [5]

Einige Sprachgesetze[Bearbeiten]

Es gibt eine ganze Reihe von Vorschlägen für Sprachgesetze, darunter:

Auch andere Spracheinheiten unterliegen diesem Gesetz: Dies betrifft die Clauselängen, Phrasenlängen, die Längen von Kola, Versen, Teilsätzen und sogenannten Hrebs[6] sowie die Längen von Sprechakten.[7] Das Gleiche gilt für die Verteilung von Lauten unterschiedlicher Dauer (Lautdauer).[8]

  • Martinsches Gesetz: Untersucht man in einem Lexikon, welches Wort geeignet ist, stichwortartig ein bestimmtes Wort zu erläutern, und führt dies weiter fort, indem man das erläuternde Wort wieder befragt, wie es selbst zu erläutern sei, so kommt man auf immer allgemeinere erläuternde Wörter. Es ergibt sich - macht man dies für viele Wörter - eine Hierarchie von immer weniger, immer allgemeineren Wörtern. Zwischen diesen Hierarchieebenen bestehen bestimmte gesetzmäßige Beziehungen.
  • Menzerathsches Gesetz, in der Linguistik auch: Menzerath-Altmann-Gesetz: Das Menzerathsche Gesetz besagt, dass je größer eine Einheit ist, d.h. aus je mehr Bestandteilen sie besteht, diese Bestandteile umso kleiner sind.
  • Rang-Häufigkeits-Gesetze: Sie betreffen eine Reihe verschiedener Sprachphänomene. Wenn man zum Beispiel in einem großen Textkorpus untersucht, welches Wort das häufigste, welches das zweithäufigste, das dritthäufigste etc. ist, und diese Wörter in eine Rangfolge bringt, in der das häufigste mit Angabe seiner Häufigkeit an erster Stelle steht, das zweithäufigste an zweiter Stelle, usw., so erhält man eine Rangordnung. Für die gesamte Rangordnung sind in der Literatur verschiedene mathematische Modelle vorgeschlagen worden. Das Verfahren kann grundsätzlich auf beliebige sprachliche Einheiten angewendet werden. Auf einige Beispiele sei hier verwiesen:
    • Buchstaben-, Laut- oder Phonemhäufigkeiten: Man bringt die betreffenden Einheiten in eine Rangskala, geordnet nach der Häufigkeit, mit der sie in Texten oder im Lexikon auftreten (Buchstabenhäufigkeit).[9]
    • Wortassoziationen: Man untersucht, welche Assoziationen Versuchspersonen wie oft mit einem bestimmten Wort als Stimulus verbinden.[10]
    • Worthäufigkeiten: Wörter eines Textkorpus werden nach Häufigkeit geordnet in eine Rangordnung gebracht (Häufigkeitsklasse).
  • Sprachwandelgesetz: Wortschatzwachstum einer Sprache, Ausbreitung von Entlehnungen bzw. Fremdwörtern, Veränderungen im Flexionssystem und viele andere Sprachwandelprozesse unterliegen einem Gesetz, das in der Linguistik als Piotrowski-Gesetz bekannt ist und Wachstumsgesetzen (bzw. -modellen) in anderen Wissenschaften entspricht. In diesem Fall handelt es sich um den Typ des logistischen Modells bzw. des logistischen Gesetzes (s. logistische Gleichung). Dieser Typ des Sprachwandelgesetzes erweist sich auch bei Prozessen im Spracherwerb als geeignet, so dass man es auch als Spracherwerbsgesetz auffassen kann.
  • Textblockgesetz: Bildet man in einem Text gleich lange Textblöcke, kann man zeigen, dass die Häufigkeit, mit der sprachliche Einheiten – zum Beispiel verschiedene Buchstaben oder Wörter – in diesen Textblöcken vorkommen, gesetzmäßig verteilt sind.
  • Zipfsches Gesetz, besser: Zipfsche Gesetze: Als Zipfsches Gesetz wird hauptsächlich angesprochen, dass das Produkt aus Rang und Frequenz, etwa der Wörter in einem Häufigkeitswörterbuch (Frequenzwörterbuch), annähernd konstant ist. Man spricht deshalb besser von Zipfschen Gesetzen, weil dieses nicht das einzige Sprachgesetz ist, das Zipf vorgeschlagen hat.

Man kann mit etwas veränderter Perspektive auch einmal fragen, welche Gesetzmäßigkeiten bei einer bestimmten Art sprachlicher Einheiten zu erwarten sind. Altmann hat dies am Beispiel der Komposita entwickelt. In diesem Fall kommt man auf eine Reihe von Gesetzeshypothesen, die teilweise noch der Überprüfung harren. Eines der Ergebnisse besteht darin, dass kürzere Wörter eher bei der Bildung von Derivationen (Ableitungen) oder Komposita beteiligt sind als längere.[11] Auch die Polysemie von Wörtern beeinflusst das Maß, in dem sie an der Bildung neuer Wörter beteiligt sind.[12]

Stilforschung[Bearbeiten]

Die Untersuchung literarischer ebenso wie nichtliterarischer Stile kann sich der Sprachstatistik bedienen; sie kann aber darüber hinaus ihre Forschungen auch auf die speziellen Ausprägungen der Sprachgesetze in bestimmten Stilen widmen. In solchen Fällen unterstützt die Quantitative Linguistik die Stilistik in ihrem Bemühen, möglichst objektive Erkenntnisse zu gewinnen und stilistische Phänomene wenigstens teilweise durch Bezug auf die Sprachgesetze zu erklären. Es gehört zu den Grundannahmen der Quantitativen Linguistik, dass zum Beispiel Wortlängenverteilungen in verschiedenen Textsorten möglicherweise verschiedene Verteilungsmodelle, mindestens aber unterschiedliche Parameterwerte zeitigen. Wenn diese Bemühungen vorwiegend literarischen Texten gelten, ist die Quantitative Stilistik (Stilometrie) als eine Teildisziplin der Quantitativen Literaturwissenschaft gefordert.

Bekannte Autoren[Bearbeiten]

Literatur[Bearbeiten]

(Weitere, vor allem speziellere Literatur in den Artikeln zu den einzelnen Gesetzen und zur linguistischen Synergetik.)

  • Gabriel Altmann: Sprachtheorie und mathematische Modelle. In: Christian-Albrechts-Universität Kiel, SAIS [= Seminar für Allgemeine und Indogermanische Sprachwissenschaft] Arbeitsberichte. H. 8, 1985, S. 1–13.
  • Gabriel Altmann, Dariusch Bagheri, Hans Goebl, Reinhard Köhler, Claudia Prün: Einführung in die quantitative Lexikologie. Peust & Gutschmidt, Göttingen 2002, ISBN 3-933043-09-3.
  • Vivien Altmann, Gabriel Altmann: Anleitung zu quantitativen Textanalysen. Methoden und Anwendungen. RAM-Verlag, Lüdenscheid 2008. ISBN 978-3-9802659-5-9
  • Karl-Heinz Best: Quantitative Linguistik. Eine Annäherung. 3., stark überarbeitete und ergänzte Auflage. Peust & Gutschmidt, Göttingen 2006, ISBN 3-933043-17-4.
  • Emmerich Kelih: Geschichte der Anwendung quantitativer Verfahren in der russischen Sprach- und Literaturwissenschaft. Kovač, Hamburg 2008. ISBN 978-3-8300-3575-6. (Zugleich Dissertation Graz, 2007. Ausführliche Darstellung des Beitrags der russischen Sprach- und Literaturwissenschaft von der Mitte des 19. Jahrhunderts an, die für die Entwicklung der quantitativen/statistischen Linguistik und Literaturwissenschaft besonders wichtig ist.)
  • Reinhard Köhler with the assistance of Christiane Hoffmann: Bibliography of Quantitative Linguistics. Benjamins, Amsterdam/ Philadelphia 1995, ISBN 90-272-3751-4.
  • Reinhard Köhler, Gabriel Altmann, Gabriel, Rajmund G. Piotrowski (Hrsg.): Quantitative Linguistik - Quantitative Linguistics. Ein internationales Handbuch. de Gruyter, Berlin/ New York 2005, ISBN 3-11-015578-8.
  • Haitao Liu & Wei Huang. Quantitative Linguistics:State of the Art, Theories and Methods. Journal of Zhejiang University (Humanities and Social Science). 2012,43(2):178-192. in Chinese.
  • Udo Strauss, Fengxiang Fan, & Gabriel Altmann: Problems in Quantitative Linguistics 1. RAM-Verlag, Lüdenscheid 2008, ISBN 978-3-9802659-4-2.
  • Stephen Ullmann: Panchronische statistische Gesetze. In: ders.: Grundzüge der Semantik. Die Bedeutung in sprachwissenschaftlicher Sicht. de Gruyter, Berlin 1967, S. 267–272.

Einzelnachweise[Bearbeiten]

  1. Burghard Rieger: Warum mengenorientierte Textwissenschaft? Zur Begründung der Statistik als Methode in: Gunzenhäuser, R. (Hrsg.): Mathematisch orientierte Textwissenschaft (Zeitschrift für Literaturwissenschaft und Linguistik 8), Athenäum, Frankfurt/M. 1972, S. 11-28
  2. Reinhard Köhler: Gegenstand und Arbeitsweise der Quantitativen Linguistik. In: Reinhard Köhler, Gabriel Altmann, Rajmund G. Piotrowski (Hrsg.): Quantitative Linguistik - Quantitative Linguistics. Ein internationales Handbuch. de Gruyter, Berlin/ New York 2005, S. 1-16. ISBN 3-11-015578-8
  3. N.L. Biggs: The Roots of Combinatorics. In: Historia Mathematica 6, 1979, S. 109-136.
  4. Adam Pawłowski: Prolegomena to the History of Corpus and Quantitative Linguistics. Greek Antiquity. In: Glottotheory 1, 2008, S. 48-54.
  5. Quelle siehe Anmerkung 1, S. 1f.
  6. http://lql.uni-trier.de/index.php/Hreb_length; s. dazu Luděk Hřebíček
  7. http://lql.uni-trier.de/index.php/Speech_act_length
  8. http://lql.uni-trier.de/index.php/Vowel_duration
  9. http://lql.uni-trier.de/index.php/Phoneme_frequency
  10. http://lql.uni-trier.de/index.php/Word_associations
  11. http://lql.uni-trier.de/index.php/Compounds:_further_hypotheses; http://lql.uni-trier.de/index.php/Morphological_productivity
  12. http://lql.uni-trier.de/index.php/Compounds_and_polysemy
  13. http://www.glottopedia.de/index.php/Hans_Arens; Karl-Heinz Best: Hans Arens (1911–2003). In: Glottometrics 13, 2006, S. 75–79.
  14. http://www.ualberta.ca/~baayen/
  15. http://www.glottopedia.org/index.php/Adolf_Busemann_(de)
  16. http://www.yorku.ca/embleton/
  17. http://en.wikipedia.org/wiki/William_Palin_Elderton; Best, Karl-Heinz (2009): William Palin Elderton (1877–1962). Glottometrics 19, p. 99–101.
  18. http://wwwu.uni-klu.ac.at/gfenk/
  19. Karl-Heinz Best: Ernst Wilhelm Förstemann (1822–1906). In: Glottometrics 12, 2006, S. 77–86
  20. * Dieter Aichele: Das Werk von W. Fucks. In: Reinhard Köhler, Gabriel Altmann, Rajmund G. Piotrowski (Hrsg.): Quantitative Linguistik – Quantitative Linguistics. Ein internationales Handbuch. de Gruyter, Berlin/ New York 2005, S. 152–158. ISBN 3-11-015578-8
  21. http://www.glottopedia.de/index.php/Georg_von_der_Gabelentz
  22. http://www.peter-grzybek.eu
  23. http://slawistik.univie.ac.at/mitarbeiter/kelih-emmerich/
  24. Karl-Heinz Best: Karl Knauer (1906–1966). In: Glottometrics 12, 2006, S. 86–94
  25. http://www.uni-trier.de/index.php?id=11131
  26. http://www.uni-goettingen.de/de/51122.html
  27. http://www.glottopedia.de/index.php/Gottfried_Wilhelm_Leibniz
  28. Festschrift zum 70. Geburtstag: Problems of General, Germanic and Slavic Linguistics. Papers for 70-th Anniversary of Professor V. Levickij. Herausgegeben von Gabriel Altmann, Iryna Zadoroshna, Yuliya Matskulyak. Books, Chernivtsi 2008. (Es gibt keine ISBN.) Aus gleichem Anlass ist Levickij Glottometrics, Heft 16, 2008, gewidmet. Eine weitere Würdigung: Emmerich Kelih: Der Czernowitzer Beitrag zur Quantitativen Linguistik: Zum 70. Geburtstag von Prof. Dr. Habil. Viktor V. Levickij. In: Naukovyj Visnyk Černivec’koho Universytetu: Hermans’ka filolohija. Vypusk 407, 2008, S. 3–10.
  29. http://mypage.zju.edu.cn/en/lht
  30. http://wiki-lingua.uni-trier.de/index.php/Karl_Marbe
  31. Karl-Heinz Best: Paul Menzerath (1883–1954). In: Glottometrics 14, 2007, 86–98
  32. http://users.uoa.gr/~gmikros/index.htm
  33. Auch in der Form: Shizuo Mizutani; Portrait zum 80. Geburtstag in: Glottometrics 12, 2006; über Mizutani: Naoko Maruyama: Sizuo Mizutani (1926). The Founder of Japanese Quantitative Linguistics. In: Glottometrics 10, 2005, S. 99–107.
  34. Charles Muller: Einführung in die Sprachstatistik. Hueber, München 1972 (frz. 1968)
  35. Auch in den Schreibweisen: Rajmund G. Piotrowski, R.G. Piotrovskij. Würdigung: http://www.iqla.org/news/iqla_archive.html
  36. http://www.iipopescu.com/IOAN-IOVITZ_POPESCU.html
  37. http://www.uni-trier.de/index.php?id=20614
  38. http://www.glottopedia.de/index.php/August_Schleicher
  39. Porträt, Würdigung und Bibliographie der Werke Tuldavas in: Journal of Quantitative Linguistics 4, Nr. 1, 1997 (= Festschrift in Honour of Juh. Tuldava)
  40. Ludmila Uhlířová: Bohumil Trnka: The first bibliography. In: Glottometrics 6, 2003, 105–106.

Siehe auch[Bearbeiten]

Weblinks[Bearbeiten]

 Wiktionary: Quantitative Linguistik – Bedeutungserklärungen, Wortherkunft, Synonyme, Übersetzungen