Natural Language Toolkit

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Natural Language Toolkit
Entwickler NLTK-Entwicklerteam (ursprünglich Steven Bird, Ewan Klein und Edward Loper)
Aktuelle Version 2.0.4
(November 2012)
Betriebssystem plattformunabhängig
Kategorie Toolkit für Natural Language Processing
Lizenz Apache 2.0[1]
Deutschsprachig nur einzelne Module
nltk.org

Das Natural Language Toolkit (NLTK) ist eine Zusammenstellung von Bibliotheken und Programmen der Programmiersprache Python (ab Version 2.6) für Anwendungen der Computerlinguistik. Das NLTK ist quelloffen und wird unter der Apache-Lizenz vertrieben.[2]

Die Entwicklung des NLTK begann im Jahr 2001 an der University of Pennsylvania unter Edward Loper und Steven Bird, beide leiten das Projekt seitdem gemeinsam mit Ewan Klein.[3] Da NLTK in erster Linie zu Lehrzwecken entwickelt und dementsprechend angelegt wurde, ist eine umfangreiche Dokumentation, inklusive eines begleitenden, von den NLTK-Entwicklern selbst verfassten Lehrbuchs zur (symbolischen wie auch statistischen) Sprachverarbeitung in Python[4] fester Bestandteil des Projekts. Verbreitung fand das NLTK daher insbesondere im Lehrbereich der Linguistik bzw. Computerlinguistik, des Information Retrieval und Maschinellen Lernens sowie den Kognitionswissenschaften, es kann und wird darüber hinaus jedoch auch in der Forschung eingesetzt.

Literatur[Bearbeiten]

  • Jacob Perkins: Python Text Processing with NLTK 2.0 Cookbook. Packt Publishing, 2010. ISBN 978-1-849-51360-9
  • Steven Bird, Ewan Klein, Edward Loper: Natural Language Processing with Python. O'Reilly Media, 2009. ISBN 978-0-596-51649-9

Weblinks[Bearbeiten]

Einzelnachweise[Bearbeiten]

  1. NLTK License
  2. https://github.com/nltk/nltk/wiki/FAQ
  3. http://code.google.com/p/nltk/wiki/People
  4. Bird, Steven; Ewan Klein; Edward Loper (2009): Natural Language Processing with Python, O'Reilly Media Inc., ISBN 0-596-51649-5.