RapidMiner

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
RapidMiner
Ein Bildschirmfoto von RapidMiner (YALE)
Ein Bildschirmfoto von RapidMiner (YALE).
Basisdaten
Entwickler rapidminer.com
Aktuelle Version 6.0
(21. November 2013)
Betriebssystem Plattformunabhängig
Kategorie Künstliche Intelligenz
Lizenz AGPL
Deutschsprachig ja
SourceForge-Projektseite

RapidMiner, zuvor YALE (Yet Another Learning Environment) genannt, ist eine Umgebung für maschinelles Lernen und Data-Mining. Experimente können aus einer großen Zahl von nahezu beliebig schachtelbaren Operatoren erzeugt werden. Der Experimentaufbau wird durch XML beschrieben und mittels einer graphischen Benutzeroberfläche entwickelt. RapidMiner deckt sowohl Forschungs- als auch industrielle und wirtschaftliche Anwendungen ab.

YALE wurde seit 2001 vom Lehrstuhl für künstliche Intelligenz der Technischen Universität Dortmund entwickelt. Seit 2004 wird YALE bei SourceForge gehostet. Im Mai 2007 wurde YALE in RapidMiner umbenannt; im Juli 2007 erschien die Version 4.0 und im November 2008 die Version 4.3. RapidMiner ist als proprietäre Version erhältlich, sowie die jeweilige Vorversion als Open-Source-Software unter der AGPL auf Sourceforge[1].

RapidMiner beinhaltet mehr als 500 Operatoren für alle Aufgaben der Wissensentdeckung in Datenbanken, d.h. Operatoren für Ein- und Ausgabe, Datenvorverarbeitung, maschinelles Lernen, Data-Mining, Text Mining, Web Mining, automatische Stimmungsanalyse aus Internet-Diskussionsforen (Sentiment Analysis, Opinion Mining), Zeitreihenanalyse und Prognose. Zusätzlich stehen mehr als 20 Verfahren bereit, auch hochdimensionale Daten und Modelle zu visualisieren. RapidMiner wurde in Java geschrieben und kann daher auf allen gängigen Betriebssystemen verwendet werden. Alle Lernverfahren und Attributeevaluatoren von WEKA wurden ebenfalls integriert.

Eigenschaften[Bearbeiten]

Einige Eigenschaften von RapidMiner sind:

  • Prozesse der Wissensentdeckung werden als Operatorbäume modelliert
  • Interne XML-Repräsentation sichert einen Standard für den Austausch von Data-Mining-Experimenten
  • Skriptsprache erlaubt automatisiertes large-scale Data Mining
  • Multi-layered data view concept sichert effiziente und transparente Datenhaltung
  • Graphische Benutzeroberfläche sowie Kommandozeilentool. Eine Java-API erlaubt die Benutzung von RapidMiner aus eigenen Javaprogrammen
  • Plugin und Erweiterungsmechanismus, es existieren bereits einige Plugins, z.B. zur Clusteranalyse
  • Große Anzahl hochdimensionaler Visualisierungen für Daten und Modelle
  • Anwendungen umfassen Text Mining, Multimedia Mining, Feature Engineering, Data Stream Mining und Lernen veränderlicher Konzepte, Entwicklung von Ensemble-Methoden und verteiltes Data Mining.

Siehe auch[Bearbeiten]

Weblinks[Bearbeiten]

Einzelnachweise[Bearbeiten]

  1. Fehler beim Aufruf der Vorlage:cite web: Die Parameter url und title müssen vorhanden sein. RapidMiner. Abgerufen am 18. Juli 2014.