„Knowledge Discovery in Databases“ – Versionsunterschied

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen
[ungesichtete Version][gesichtete Version]
Inhalt gelöscht Inhalt hinzugefügt
K +URV
Zeile 1: Zeile 1:
'''Knowledge Discovery in Databases''' ('''KDD''') stellt einen [[Oberbegriff]] zum bekannteren Begriff [[Data-Mining]] (''data mining'') dar. Generell ist die Zielsetzung des KDD, in gegebenen großen Datenmengen bislang unbekannte und nützliche Zusammenhänge zu erkennen. Während Data Mining meistens den Schritt der eigentlichen [[Datenanalyse]] meint, umfasst KDD als Gesamtprozess auch die Vorbereitung der Daten sowie die [[Bewertung]] der [[Resultat]]e.
'''Knowledge Discovery in Databases''' ('''KDD'''), zu Deutsch ''Erkenntnisgewinnung aus Datenbeständen'', umfasst das geläufigere [[Data-Mining]] (''data mining'') und vorbereitende Analysen hierzu. Ziel des KDD ist die Erkennung bislang unbekannter fachlicher Zusammenhänge aus vorhandenen, meist großen Datenbeständen. In Abgrenzung zum ''Data Mining'' umfasst KDD als Gesamtprozess auch die Vorbereitung der Daten sowie die [[Bewertung]] der [[Resultat]]e. Die Teilschritte des KDD-Prozesses sind

Der KDD-Prozess läuft in einer Reihe von Schritten ab:


# Bereitstellung von ''Hintergrundwissen'' für den jeweiligen Fachbereich
# Bereitstellung von ''Hintergrundwissen'' für den jeweiligen Fachbereich
Zeile 12: Zeile 10:
# [[Interpretation]] der gewonnenen [[Erkenntnis]]se
# [[Interpretation]] der gewonnenen [[Erkenntnis]]se


Üblicherweise werden diese Schritte [[Iteration|iterativ]] mehrfach durchlaufen.
Üblicherweise werden diese Schritte mehrfach durchlaufen. Das zugehörige Vorgehensmodell ist [[CRISP-DM]].


{{URV}} http://www.wissensexploration.de/datamining-kdd-definition.php --[[Benutzer:Chire|Chire]] 23:56, 27. Feb. 2011 (CET)
Mit dem [[CRISP-DM]] wurde ein Vorgehensmodell für das Durchführen Knowledge Discovery/[[Data Mining]] Projekten geschaffen.


== Software ==
== Software ==


* [http://yale.sf.net YALE] ist ein frei erhältliches Open Source Tool für [[Maschinelles Lernen]] und [[Data-Mining]], das die eher technischen Schritte der Wissensentdeckung (Datenauswahl, Datenbereinigung, Datenreduktion, Modellbildung, Visualisierung etc.) unterstützt
* [[RapidMiner]] ist ein frei erhältliches Open Source Tool für [[Maschinelles Lernen]] und [[Data-Mining]], das die eher technischen Schritte der Wissensentdeckung (Datenauswahl, Datenbereinigung, Datenreduktion, Modellbildung, Visualisierung etc.) unterstützt
* [http://www.cs.waikato.ac.nz/ml/weka/ WEKA] ist ein Open Source Tool, welches von der Universität von Waikato entwickelt wurde. Es enthält eine umfangreiche Sammlung von Algorithmen zur [[Knowledge Discovery in Databases]].
* [http://www.cs.waikato.ac.nz/ml/weka/ WEKA] ist ein Open Source Tool, welches von der Universität von Waikato entwickelt wurde. Es enthält eine umfangreiche Sammlung von Algorithmen zur Knowledge Discovery in Databases.
* [[Environment for DeveLoping KDD-Applications Supported by Index-Structures]] ist ein Forschungsprojekt der [[Ludwig-Maximilians-Universität München]], das zahlreiche Data-Mining-Algorithmen enthält (vor allem zur [[Clusteranalyse]] und [[Ausreißer|Outlier]]-Erkennung, aber auch [[Indexstruktur]]en), zur Verwendung in Lehre und Forschung.


== Weblinks ==
== Literatur ==


* {{Literatur
* [http://www.kdml-bonn.de KDML Bonn] Knowledge Discovery & Machine Learning Forschungsgruppe in Bonn
| Autor=Martin Ester, Jörg Sander
| Titel=Knowledge Discovery in Databases: Techniken und Anwendungen
| Verlag=[[Springer]]
| Ort=Berlin
| Jahr=2000
| ISBN=3540673288
}}
* Fayyad, Usama; Piatetsky-Shapiro, Gregory und Smyth Padhraic (1996), ''From Data Mining to Knowledge Discovery in Databases'', AI Magazine, American Association for Artificial Intelligence, California, USA, Seite 37-54.
* Alpar, Paul und Niederreichholz, Joachim (2000), ''Data Mining im praktischen Einsatz: Verfahren und Anwendungsfälle für Marketing'', Vertrieb, Controlling und Kundenunterstützung, Vieweg Verlag, Wiesbaden, Deutschland.


[[Kategorie:Dokumentation]]
[[Kategorie:Dokumentation]]
[[Kategorie:Datenbank]]

[[en:Knowledge discovery]]
[[sk:Objavovanie znalostí v databázach]]

Version vom 28. Februar 2011, 00:56 Uhr

Knowledge Discovery in Databases (KDD), zu Deutsch Erkenntnisgewinnung aus Datenbeständen, umfasst das geläufigere Data-Mining (data mining) und vorbereitende Analysen hierzu. Ziel des KDD ist die Erkennung bislang unbekannter fachlicher Zusammenhänge aus vorhandenen, meist großen Datenbeständen. In Abgrenzung zum Data Mining umfasst KDD als Gesamtprozess auch die Vorbereitung der Daten sowie die Bewertung der Resultate. Die Teilschritte des KDD-Prozesses sind

  1. Bereitstellung von Hintergrundwissen für den jeweiligen Fachbereich
  2. Definition der Ziele der Wissensfindung
  3. Datenauswahl
  4. Datenbereinigung
  5. Datenreduktion (z. B. durch Transformationen)
  6. Auswahl eines Modells, in dem das gefundene Wissen repräsentiert werden soll
  7. Data-Mining, die eigentliche Datenanalyse
  8. Interpretation der gewonnenen Erkenntnisse

Üblicherweise werden diese Schritte mehrfach durchlaufen. Das zugehörige Vorgehensmodell ist CRISP-DM.

Wegen eines möglichen Verstoßes gegen das Urheberrecht wurde der hier stehende Text entfernt und diese Seite auf der Löschkandidatenseite für potenzielle Urheberrechtsverletzungen gelistet. Der Text ist – zumindest in Auszügen – der gleiche wie in der unten genannten Quelle.

Falls eine Erlaubnis bestand, das Material gemäß den Bestimmungen der Lizenz Creative-Commons-Lizenz Namensnennung – Weitergabe unter gleichen Bedingungen 4.0 zu nutzen, oder du selbst der Urheber des Textes in der unten angeführten Quelle bist, sende bitte eine vollständig ausgefüllte Freigabeerklärung unter Verwendung deines Realnamens und der Angabe, um welchen Artikel es geht, an die Adresse permissions-de@ – at-Zeichen für E-Mailwikimedia.org per E-Mail.

Wenn du den Rechteinhaber nachträglich um Erlaubnis bitten willst, kannst du diese Textvorlage dafür benutzen.

Nach Bearbeitung durch das Wikipedia-Support-Team wird die Freigabe auf der Diskussionsseite dokumentiert und der Text wiederhergestellt.

Fragen bitte an: Urheberrechtsfragen

Diesen Artikel bitte nur bearbeiten, wenn sicher ist, dass keine Freigabe erfolgen wird!

Herkunft: http://www.wissensexploration.de/datamining-kdd-definition.php --Chire 23:56, 27. Feb. 2011 (CET)

Software

Literatur

  • Martin Ester, Jörg Sander: Knowledge Discovery in Databases: Techniken und Anwendungen. Springer, Berlin 2000, ISBN 3-540-67328-8.
  • Fayyad, Usama; Piatetsky-Shapiro, Gregory und Smyth Padhraic (1996), From Data Mining to Knowledge Discovery in Databases, AI Magazine, American Association for Artificial Intelligence, California, USA, Seite 37-54.
  • Alpar, Paul und Niederreichholz, Joachim (2000), Data Mining im praktischen Einsatz: Verfahren und Anwendungsfälle für Marketing, Vertrieb, Controlling und Kundenunterstützung, Vieweg Verlag, Wiesbaden, Deutschland.