Nutch

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Nutch
Lucene Nutch Logo
Entwickler Apache Software Foundation
Aktuelle Version 2.2.1
(2. Juli 2013)
Betriebssystem Cross-platform
Kategorie Crawler, Parser und Suchmaschine.
Lizenz Apache-Lizenz
Deutschsprachig Nein
nutch.apache.org

Nutch ist ein Java-Framework für Internet-Suchmaschinen. Die Software ist Open-Source und wird innerhalb der Apache Software Foundation unter der Apache-Lizenz entwickelt. Nutch basiert u.a. auf Lucene (Stemming, Indexierung etc.), Solr (Webfunktionalitäten) und Hadoop (Skalierung).

Nutch kann beliebig große Datenmengen durchsuchen. An firmenspezifische Bedürfnisse lässt es sich durch seine Plug-in-Architektur anpassen – bspw. an weitere Dokumentformate.

Das deutsche Bundesamt für Verbraucherschutz und Lebensmittelsicherheit betreibt die auf Nutch basierende „Verbraucher-Suchmaschine“ Clewwa. Auch die Suchmaschine Wikia Search setzte auf der Technologie von Nutch auf.

Weblinks[Bearbeiten]