Nutch

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Nutch
Lucene Nutch Logo
Entwickler Apache Software Foundation
Aktuelle Version 2.3
(22. Januar 2015)
Betriebssystem Cross-platform
Programmiersprache Java
Kategorie Crawler, Parser und Suchmaschine.
Lizenz Apache-Lizenz
deutschsprachig Nein
nutch.apache.org

Nutch ist ein Java-Framework für Internet-Suchmaschinen. Die Software ist Open-Source und wird innerhalb der Apache Software Foundation unter der Apache-Lizenz entwickelt. Nutch basiert u. a. auf Lucene (Stemming, Indexierung etc.), Solr (Webfunktionalitäten) und Hadoop (Skalierung).

Nutch kann beliebig große Datenmengen durchsuchen. An firmenspezifische Bedürfnisse lässt es sich durch seine Plug-in-Architektur anpassen – bspw. an weitere Dokumentformate.

Das deutsche Bundesamt für Verbraucherschutz und Lebensmittelsicherheit betreibt die auf Nutch basierende „Verbraucher-Suchmaschine“ Clewwa. Auch die Suchmaschine Wikia Search setzte auf der Technologie von Nutch auf.

Weblinks[Bearbeiten | Quelltext bearbeiten]