„Knowledge Discovery in Databases“ – Versionsunterschied
Zur Navigation springen
Zur Suche springen
[ungesichtete Version] | [gesichtete Version] |
Inhalt gelöscht Inhalt hinzugefügt
Chire (Diskussion | Beiträge) K +URV |
|||
Zeile 1: | Zeile 1: | ||
'''Knowledge Discovery in Databases''' ('''KDD''') |
'''Knowledge Discovery in Databases''' ('''KDD'''), zu Deutsch ''Erkenntnisgewinnung aus Datenbeständen'', umfasst das geläufigere [[Data-Mining]] (''data mining'') und vorbereitende Analysen hierzu. Ziel des KDD ist die Erkennung bislang unbekannter fachlicher Zusammenhänge aus vorhandenen, meist großen Datenbeständen. In Abgrenzung zum ''Data Mining'' umfasst KDD als Gesamtprozess auch die Vorbereitung der Daten sowie die [[Bewertung]] der [[Resultat]]e. Die Teilschritte des KDD-Prozesses sind |
||
Der KDD-Prozess läuft in einer Reihe von Schritten ab: |
|||
# Bereitstellung von ''Hintergrundwissen'' für den jeweiligen Fachbereich |
# Bereitstellung von ''Hintergrundwissen'' für den jeweiligen Fachbereich |
||
Zeile 12: | Zeile 10: | ||
# [[Interpretation]] der gewonnenen [[Erkenntnis]]se |
# [[Interpretation]] der gewonnenen [[Erkenntnis]]se |
||
Üblicherweise werden diese Schritte [[ |
Üblicherweise werden diese Schritte mehrfach durchlaufen. Das zugehörige Vorgehensmodell ist [[CRISP-DM]]. |
||
{{URV}} http://www.wissensexploration.de/datamining-kdd-definition.php --[[Benutzer:Chire|Chire]] 23:56, 27. Feb. 2011 (CET) |
|||
Mit dem [[CRISP-DM]] wurde ein Vorgehensmodell für das Durchführen Knowledge Discovery/[[Data Mining]] Projekten geschaffen. |
|||
== Software == |
== Software == |
||
* [ |
* [[RapidMiner]] ist ein frei erhältliches Open Source Tool für [[Maschinelles Lernen]] und [[Data-Mining]], das die eher technischen Schritte der Wissensentdeckung (Datenauswahl, Datenbereinigung, Datenreduktion, Modellbildung, Visualisierung etc.) unterstützt |
||
* [http://www.cs.waikato.ac.nz/ml/weka/ WEKA] ist ein Open Source Tool, welches von der Universität von Waikato entwickelt wurde. Es enthält eine umfangreiche Sammlung von Algorithmen zur |
* [http://www.cs.waikato.ac.nz/ml/weka/ WEKA] ist ein Open Source Tool, welches von der Universität von Waikato entwickelt wurde. Es enthält eine umfangreiche Sammlung von Algorithmen zur Knowledge Discovery in Databases. |
||
* [[Environment for DeveLoping KDD-Applications Supported by Index-Structures]] ist ein Forschungsprojekt der [[Ludwig-Maximilians-Universität München]], das zahlreiche Data-Mining-Algorithmen enthält (vor allem zur [[Clusteranalyse]] und [[Ausreißer|Outlier]]-Erkennung, aber auch [[Indexstruktur]]en), zur Verwendung in Lehre und Forschung. |
|||
== |
== Literatur == |
||
* {{Literatur |
|||
* [http://www.kdml-bonn.de KDML Bonn] Knowledge Discovery & Machine Learning Forschungsgruppe in Bonn |
|||
| Autor=Martin Ester, Jörg Sander |
|||
| Titel=Knowledge Discovery in Databases: Techniken und Anwendungen |
|||
| Verlag=[[Springer]] |
|||
| Ort=Berlin |
|||
| Jahr=2000 |
|||
| ISBN=3540673288 |
|||
}} |
|||
* Fayyad, Usama; Piatetsky-Shapiro, Gregory und Smyth Padhraic (1996), ''From Data Mining to Knowledge Discovery in Databases'', AI Magazine, American Association for Artificial Intelligence, California, USA, Seite 37-54. |
|||
* Alpar, Paul und Niederreichholz, Joachim (2000), ''Data Mining im praktischen Einsatz: Verfahren und Anwendungsfälle für Marketing'', Vertrieb, Controlling und Kundenunterstützung, Vieweg Verlag, Wiesbaden, Deutschland. |
|||
[[Kategorie:Dokumentation]] |
[[Kategorie:Dokumentation]] |
||
[[Kategorie:Datenbank]] |
|||
[[en:Knowledge discovery]] |
|||
[[sk:Objavovanie znalostí v databázach]] |
Version vom 28. Februar 2011, 00:56 Uhr
Knowledge Discovery in Databases (KDD), zu Deutsch Erkenntnisgewinnung aus Datenbeständen, umfasst das geläufigere Data-Mining (data mining) und vorbereitende Analysen hierzu. Ziel des KDD ist die Erkennung bislang unbekannter fachlicher Zusammenhänge aus vorhandenen, meist großen Datenbeständen. In Abgrenzung zum Data Mining umfasst KDD als Gesamtprozess auch die Vorbereitung der Daten sowie die Bewertung der Resultate. Die Teilschritte des KDD-Prozesses sind
- Bereitstellung von Hintergrundwissen für den jeweiligen Fachbereich
- Definition der Ziele der Wissensfindung
- Datenauswahl
- Datenbereinigung
- Datenreduktion (z. B. durch Transformationen)
- Auswahl eines Modells, in dem das gefundene Wissen repräsentiert werden soll
- Data-Mining, die eigentliche Datenanalyse
- Interpretation der gewonnenen Erkenntnisse
Üblicherweise werden diese Schritte mehrfach durchlaufen. Das zugehörige Vorgehensmodell ist CRISP-DM.
Herkunft: http://www.wissensexploration.de/datamining-kdd-definition.php --Chire 23:56, 27. Feb. 2011 (CET)
Software
- RapidMiner ist ein frei erhältliches Open Source Tool für Maschinelles Lernen und Data-Mining, das die eher technischen Schritte der Wissensentdeckung (Datenauswahl, Datenbereinigung, Datenreduktion, Modellbildung, Visualisierung etc.) unterstützt
- WEKA ist ein Open Source Tool, welches von der Universität von Waikato entwickelt wurde. Es enthält eine umfangreiche Sammlung von Algorithmen zur Knowledge Discovery in Databases.
- Environment for DeveLoping KDD-Applications Supported by Index-Structures ist ein Forschungsprojekt der Ludwig-Maximilians-Universität München, das zahlreiche Data-Mining-Algorithmen enthält (vor allem zur Clusteranalyse und Outlier-Erkennung, aber auch Indexstrukturen), zur Verwendung in Lehre und Forschung.
Literatur
- Martin Ester, Jörg Sander: Knowledge Discovery in Databases: Techniken und Anwendungen. Springer, Berlin 2000, ISBN 3-540-67328-8.
- Fayyad, Usama; Piatetsky-Shapiro, Gregory und Smyth Padhraic (1996), From Data Mining to Knowledge Discovery in Databases, AI Magazine, American Association for Artificial Intelligence, California, USA, Seite 37-54.
- Alpar, Paul und Niederreichholz, Joachim (2000), Data Mining im praktischen Einsatz: Verfahren und Anwendungsfälle für Marketing, Vertrieb, Controlling und Kundenunterstützung, Vieweg Verlag, Wiesbaden, Deutschland.