„Parallele Koordinaten“ – Versionsunterschied

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen
[gesichtete Version][gesichtete Version]
Inhalt gelöscht Inhalt hinzugefügt
K ss -> ß, Wikiform
Zeile 1: Zeile 1:
[[File:Ggobi-flea2.png|miniatur|Ggobi-flea2|Paralleler Koordinatenplot von Flohkäfer-Daten mit [[GGobi]].]]
[[Datei:Ggobi-flea2.png|miniatur|Ggobi-flea2|Paralleler Koordinatenplot von Flohkäfer-Daten mit [[GGobi]].]]


'''Parallele Koordinaten''' (auch ''||-Koordinaten''; {{enS|''parallel coordinate plot''}}, ''PCP'') sind eine Methode zur [[Visualisierung]] von hochdimensionalen Strukturen und [[multivariat]]er Daten. In der rechten Grafik zeigen die senkrechten Linien die Achsen des Koordinatensystems. Anders als im [[Streudiagramm]], in dem zwei [[Koordinatenachse]]n [[rechtwinklig]] zueinander angeordnet sind, verlaufen sie hier parallel und in gleichem Abstand. Jede Linie von links nach rechts entspricht dabei einem Datenpunkt und wird durch einen [[Polygonzug (Mathematik)|Polygonzug]] mit [[Ecke]]n auf den parallelen Achsen dargestellt. Die Position der Ecke auf der i-ten Achse entspricht der i-ten Koordinate des Punktes.
'''Parallele Koordinaten''' (auch ''||-Koordinaten''; {{enS|''parallel coordinate plot''}}, ''PCP'') sind eine Methode zur [[Visualisierung]] von hochdimensionalen Strukturen und [[multivariat]]er Daten. In der rechten Grafik zeigen die senkrechten Linien die Achsen des Koordinatensystems. Anders als im [[Streudiagramm]], in dem zwei [[Koordinatenachse]]n [[rechtwinklig]] zueinander angeordnet sind, verlaufen sie hier parallel und in gleichem Abstand. Jede Linie von links nach rechts entspricht dabei einem Datenpunkt und wird durch einen [[Polygonzug (Mathematik)|Polygonzug]] mit [[Ecke]]n auf den parallelen Achsen dargestellt. Die Position der Ecke auf der i-ten Achse entspricht der i-ten Koordinate des Punktes.


== Geschichte ==
== Geschichte ==
Oft wird die Erfindung der Parallelen Koordinaten Maurice d'Ocagne im Jahre 1885 zugeschrieben<ref name="pc-first">{{cite book|author=d'Ocagne, Maurice|year=1885|title=Coordonnées Parallèles et Axiales: Méthode de transformation géométrique et procédé nouveau de calcul graphique déduits de la considération des coordonnées parallèlles|publisher=Paris: Gauthier-Villars}}</ref>, jedoch hat diese Publikation ausser dass die Wörter im Titel vorkommen mit der gleichnamigen Visualisierungstechnik nichts zu tun, sondern beschreibt lediglich eine Transformationsfunktion für Koordinatensysteme. Ausserdem gibt es zweifelsfrei schon vor 1885 Darstellungen von Parallelen Koordinaten, beispielsweise von H. Gannett und F.W. Hewes im Jahre 1883 (siehe Link in der Referenz)<ref name="hg">{{cite journal |first=Henry |last=Gannett |title=General Summary Showing the Rank of States by Ratios 1880 |url=http://www.davidrumsey.com/luna/servlet/detail/RUMSEY~8~1~32803~1152181:General-summary,-showing-the-rank-o?sort=Pub_Date%2CPub_List_No_InitialSort&qvq=q:List_No%3D%274521.152%27%22%2B;sort:Pub_Date%2CPub_List_No_InitialSort;lc:RUMSEY~8~1&mi=0&trs=1 }} </ref>. Knapp 80 Jahre später wurde im Jahre 1959 die ursprüngliche Idee von Alfred Inselberg erneut verwendet.<ref name="pc">{{cite journal|author=Alfred Inselberg|title=The Plane with Parallel Coordinates|journal=Visual Computer|volume=1|issue=4|pages=69–91|year=1985|doi=10.1007/BF01898350}}</ref> Ab 1977 wurden sie systematisch von ihm weiterentwickelt und popularisiert. Am häufigsten angewendet werden sie bei Algorithmen zur Vermeidung von Zusammenstößen im Flugverkehr (1987), beim [[Data-Mining]], bei Bildanalyseverfahren, in der Optimierung, der Prozesskontrolle, sowie der Einbruchserkennung bei Computern. Ausschlaggebend für die erfolgreiche Anwendung paralleler Koordinaten war Wegmans Artikel ''Hyperdimensional Data Analysis Using Parallel Coordinates'' aus dem Jahr 1990.<ref>{{Literatur
Oft wird die Erfindung der Parallelen Koordinaten Maurice d'Ocagne im Jahre 1885 zugeschrieben<ref name="pc-first">{{cite book|author=d'Ocagne, Maurice|year=1885|title=Coordonnées Parallèles et Axiales: Méthode de transformation géométrique et procédé nouveau de calcul graphique déduits de la considération des coordonnées parallèlles|publisher=Paris: Gauthier-Villars}}</ref>, jedoch hat diese Publikation außer dass die Wörter im Titel vorkommen mit der gleichnamigen Visualisierungstechnik nichts zu tun, sondern beschreibt lediglich eine Transformationsfunktion für Koordinatensysteme. Außerdem gibt es zweifelsfrei schon vor 1885 Darstellungen von Parallelen Koordinaten, beispielsweise von H. Gannett und F.W. Hewes im Jahre 1883 (siehe Link in der Referenz)<ref name="hg">{{cite journal |first=Henry |last=Gannett |title=General Summary Showing the Rank of States by Ratios 1880 |url=http://www.davidrumsey.com/luna/servlet/detail/RUMSEY~8~1~32803~1152181:General-summary,-showing-the-rank-o?sort=Pub_Date%2CPub_List_No_InitialSort&qvq=q:List_No%3D%274521.152%27%22%2B;sort:Pub_Date%2CPub_List_No_InitialSort;lc:RUMSEY~8~1&mi=0&trs=1 }}</ref>. Knapp 80 Jahre später wurde im Jahre 1959 die ursprüngliche Idee von Alfred Inselberg erneut verwendet.<ref name="pc">{{cite journal|author=Alfred Inselberg|title=The Plane with Parallel Coordinates|journal=Visual Computer|volume=1|issue=4|pages=69–91|year=1985|doi=10.1007/BF01898350}}</ref> Ab 1977 wurden sie systematisch von ihm weiterentwickelt und popularisiert. Am häufigsten angewendet werden sie bei Algorithmen zur Vermeidung von Zusammenstößen im Flugverkehr (1987), beim [[Data-Mining]], bei Bildanalyseverfahren, in der Optimierung, der Prozesskontrolle, sowie der Einbruchserkennung bei Computern. Ausschlaggebend für die erfolgreiche Anwendung paralleler Koordinaten war Wegmans Artikel ''Hyperdimensional Data Analysis Using Parallel Coordinates'' aus dem Jahr 1990.<ref>{{Literatur
|Autor = Edward J. Wegman
|Autor = Edward J. Wegman
|Titel = Hyperdimensional Data Analysis Using Parallel Coordinates
|Titel = Hyperdimensional Data Analysis Using Parallel Coordinates
Zeile 15: Zeile 15:
}}</ref>
}}</ref>


Generalisierte parallele Koordinaten wurden 2002 und 2006 von Moustafa und Wegman vorgeschlagen.<ref name="Gpc1">
Generalisierte parallele Koordinaten wurden 2002 und 2006 von Moustafa und Wegman vorgeschlagen.<ref name="Gpc1">{{cite journal|author=R. Moustafa, E. Wegman|title=On Some Generalization to Parallel Coordinate Plot|journal=Seeing a million, A Data
{{cite journal|author=R. Moustafa, E. Wegman|title=On Some Generalization to Parallel Coordinate Plot|journal=Seeing a million, A Data
Visualization Workshop, Rain am Lech (nr.), Germany|year=2002}}</ref><ref name="Gpc2">{{cite journal|author=R. Moustafa, E. Wegman|title=Multivariate continuous data—Parallel Coordinates|journal= In: Unwin, A., Theus M., Hofmann, H.
(Eds.), Graphics of Large Datasets: Visualizing a Million, Springer|pages= 143–156|year=2006}}</ref>
Visualization Workshop, Rain am Lech (nr.), Germany|year=2002}} </ref><ref name="Gpc2">
Hierbei wird das kartesische Koordinatensystem mittels Basisfunktionen in einen Parameterraum, und dieser dann auf parallele Koordinaten abgebildet. Dadurch lässt sich eine Verbindung zwischen generalisierten parallelen Koordinaten, der [[Grand Tour (Statistik)|Grand Tour]] und den [[Ausreißer#Andrews Kurven|Andrews-Kurven]] herstellen.
{{cite journal|author=R. Moustafa, E. Wegman|title=Multivariate continuous data—Parallel Coordinates|journal= In: Unwin, A., Theus M., Hofmann, H.
(Eds.), Graphics of Large Datasets: Visualizing a Million, Springer|pages= 143–156|year=2006}}
</ref>
Hierbei wird das kartesische Koordinatensystem mittels Basisfunktionen in einen Parameterraum, und dieser dann auf parallele Koordinaten abgebildet. Dadurch lässt sich eine Verbindung zwischen generalisierten parallelen Koordinaten, der [[Grand Tour (Statistik)|Grand Tour]] und den [[Ausreißer#Andrews_Kurven|Andrews-Kurven]] herstellen.


== Vor- und Nachteile ==
== Vor- und Nachteile ==
Zeile 31: Zeile 28:
[[Datei:ParallelCoordinatePattern.svg|800px|zentriert|Verschiedene zweidimensionale Strukturen im Streudiagramm (oben) und in Parallelen Koordinaten (unten).]]
[[Datei:ParallelCoordinatePattern.svg|800px|zentriert|Verschiedene zweidimensionale Strukturen im Streudiagramm (oben) und in Parallelen Koordinaten (unten).]]


Zur Visualisierung von hochdimensionalen Daten in der Statistik müssen drei wichtige Aspekte beachtet werden:
Zur Visualisierung von hochdimensionalen Daten in der Statistik müssen drei wichtige Aspekte beachtet werden:
;die Anordnung der Achsen
;die Anordnung der Achsen
:Die Anordnung der Achsen ist entscheidend für die Suche nach Strukturen in den Daten. In einer typischen Datenanalyse werden meist viele Anordnungen ausprobiert. Es wurden Anordnungsheuristiken entwickelt, die Einblicke in interessante Strukturen erlauben.<ref>[http://davis.wpi.edu/~xmdv/docs/tr0313_osf.pdf Interactive Hierarchical Dimension Ordering Spacing and Filtering for Exploration of High Dimensional Datasets] (Seiten 3-4; PDF; 6,0&nbsp;MB)</ref>
:Die Anordnung der Achsen ist entscheidend für die Suche nach Strukturen in den Daten. In einer typischen Datenanalyse werden meist viele Anordnungen ausprobiert. Es wurden Anordnungsheuristiken entwickelt, die Einblicke in interessante Strukturen erlauben.<ref>[http://davis.wpi.edu/~xmdv/docs/tr0313_osf.pdf Interactive Hierarchical Dimension Ordering Spacing and Filtering for Exploration of High Dimensional Datasets] (Seiten 3–4; PDF; 6,0&nbsp;MB)</ref>
;die Rotation der Achsen (Daten)
;die Rotation der Achsen (Daten)
:Da die i-te Koordinate durch die Ecke auf der i-ten Achse bestimmt wird, kann eine Rotation der Achsen (= Rotation der Daten) ein anderes Bild ergeben. Die beiden linken Grafiken können als Rotation der Achsen (oder Daten) um 90 Grad aufgefasst werden. Trotz gleicher Struktur ergeben sich unterschiedliche Strukturen in den parallelen Koordinaten.
:Da die i-te Koordinate durch die Ecke auf der i-ten Achse bestimmt wird, kann eine Rotation der Achsen (= Rotation der Daten) ein anderes Bild ergeben. Die beiden linken Grafiken können als Rotation der Achsen (oder Daten) um 90 Grad aufgefasst werden. Trotz gleicher Struktur ergeben sich unterschiedliche Strukturen in den parallelen Koordinaten.
;die Skalierung der Achsen
;die Skalierung der Achsen
:Die parallelen Koordinaten sind im Wesentlichen eine Aneinanderreihung von Linien zwischen Paaren von Koordinatenachsen.<ref name="Gpc2"/> Daher sollten die Variablen auf einen ähnlichen Maßstab skaliert sein. Verschiedene Skalierungen können ebenfalls interessante Einsichten in die Daten geben.
:Die parallelen Koordinaten sind im Wesentlichen eine Aneinanderreihung von Linien zwischen Paaren von Koordinatenachsen.<ref name="Gpc2" /> Daher sollten die Variablen auf einen ähnlichen Maßstab skaliert sein. Verschiedene Skalierungen können ebenfalls interessante Einsichten in die Daten geben.


== Literatur ==
== Literatur ==
Zeile 49: Zeile 46:
|Monat = Oktober
|Monat = Oktober
|Tag = 8
|Tag = 8
|ISBN = 978-0387215075
|ISBN = 978-0-387-21507-5
}}
}}
* {{Literatur
* {{Literatur
Zeile 56: Zeile 53:
|Verlag = Napier University
|Verlag = Napier University
|Ort = Edinburgh, UK
|Ort = Edinburgh, UK
|Online = http://www.dcs.napier.ac.uk/~marting/parCoord/GrahamKennedyParallelCurvesIV03.pdf
|Online = http://www.dcs.napier.ac.uk/~marting/parCoord/GrahamKennedyParallelCurvesIV03.pdf
|Zugriff = 29. Sep 2011
|Zugriff = 29. Sep 2011
}}
}}
Zeile 70: Zeile 67:
* [http://www.math.tau.ac.il/~aiisreal Alfred Inselberg's Homepage] mit einem Tutorial, ausgewählten Publikationen und Anwendungen
* [http://www.math.tau.ac.il/~aiisreal Alfred Inselberg's Homepage] mit einem Tutorial, ausgewählten Publikationen und Anwendungen
* [http://www.ggobi.org/docs/parallel-coordinates// Paralleler Koordinatenplot in GGobi]
* [http://www.ggobi.org/docs/parallel-coordinates// Paralleler Koordinatenplot in GGobi]
* [http://stat.ethz.ch/R-manual/R-patched/library/MASS/html/parcoord.html Paralleler Koordinatenplot in R]
* [http://stat.ethz.ch/R-manual/R-patched/library/MASS/html/parcoord.html Paralleler Koordinatenplot in R]
* [http://www.wallinfire.net/picviz picviz — the graphviz of parallel coordinates] (lizenziert unter der [[GNU GPL]] v3, implementiert in [[C (Programmiersprache)|C]])
* [http://www.wallinfire.net/picviz picviz — the graphviz of parallel coordinates] (lizenziert unter der [[GNU GPL]] v3, implementiert in [[C (Programmiersprache)|C]])
* [http://www.xdat.org/ XDAT] – eine freie JAVA-basierte Software für parallele Koordinaten
* [http://www.xdat.org/ XDAT] – eine freie JAVA-basierte Software für parallele Koordinaten
Zeile 77: Zeile 74:
<references />
<references />


[[Kategorie:Diagramm (Statistik)]]
[[Kategorie:Diagramm (Statistik)]]
[[Kategorie:Multivariate Statistik]]
[[Kategorie:Multivariate Statistik]]

Version vom 5. August 2014, 07:07 Uhr

Paralleler Koordinatenplot von Flohkäfer-Daten mit GGobi.

Parallele Koordinaten (auch ||-Koordinaten; englisch parallel coordinate plot, PCP) sind eine Methode zur Visualisierung von hochdimensionalen Strukturen und multivariater Daten. In der rechten Grafik zeigen die senkrechten Linien die Achsen des Koordinatensystems. Anders als im Streudiagramm, in dem zwei Koordinatenachsen rechtwinklig zueinander angeordnet sind, verlaufen sie hier parallel und in gleichem Abstand. Jede Linie von links nach rechts entspricht dabei einem Datenpunkt und wird durch einen Polygonzug mit Ecken auf den parallelen Achsen dargestellt. Die Position der Ecke auf der i-ten Achse entspricht der i-ten Koordinate des Punktes.

Geschichte

Oft wird die Erfindung der Parallelen Koordinaten Maurice d'Ocagne im Jahre 1885 zugeschrieben[1], jedoch hat diese Publikation außer dass die Wörter im Titel vorkommen mit der gleichnamigen Visualisierungstechnik nichts zu tun, sondern beschreibt lediglich eine Transformationsfunktion für Koordinatensysteme. Außerdem gibt es zweifelsfrei schon vor 1885 Darstellungen von Parallelen Koordinaten, beispielsweise von H. Gannett und F.W. Hewes im Jahre 1883 (siehe Link in der Referenz)[2]. Knapp 80 Jahre später wurde im Jahre 1959 die ursprüngliche Idee von Alfred Inselberg erneut verwendet.[3] Ab 1977 wurden sie systematisch von ihm weiterentwickelt und popularisiert. Am häufigsten angewendet werden sie bei Algorithmen zur Vermeidung von Zusammenstößen im Flugverkehr (1987), beim Data-Mining, bei Bildanalyseverfahren, in der Optimierung, der Prozesskontrolle, sowie der Einbruchserkennung bei Computern. Ausschlaggebend für die erfolgreiche Anwendung paralleler Koordinaten war Wegmans Artikel Hyperdimensional Data Analysis Using Parallel Coordinates aus dem Jahr 1990.[4]

Generalisierte parallele Koordinaten wurden 2002 und 2006 von Moustafa und Wegman vorgeschlagen.[5][6] Hierbei wird das kartesische Koordinatensystem mittels Basisfunktionen in einen Parameterraum, und dieser dann auf parallele Koordinaten abgebildet. Dadurch lässt sich eine Verbindung zwischen generalisierten parallelen Koordinaten, der Grand Tour und den Andrews-Kurven herstellen.

Vor- und Nachteile

Die parallelen Koordinaten haben Vor- und Nachteile:

  • Eine Erhöhung der Dimension bedeutet lediglich das Hinzufügen von weiteren (senkrechten) Achsen.
  • Da parallele Koordinaten einen höherdimensionalen Raum auf einen zweidimensionalen Raum abbilden, tritt ein Informationsverlust ein. Dieser kann mit Hilfe der Parseval-Identität gemessen werden.
  • Mit Übung sind bestimmte zweidimensionale und auch höherdimensionale Strukturen in parallelen Koordinaten leicht zu erkennen. Die Grafik unten zeigt verschiedene zweidimensionale Strukturen (perfekt positiv und negativ korrelierte Datenpunkte, Cluster, Kreis und normalverteilte Daten) einmal im Streudiagramm (oben) und in parallelen Koordinaten. Es sind Muster in parallelen Koordinaten bekannt für (Hyper-)Ebenen, Kurven, mehrere glatte (Hyper-)Flächen, Ähnlichkeiten, Konvexität und auch nicht orientierbare Flächen.[7] Die Punkt-Linie-Dualität ist ein Hinweis darauf, dass die mathematischen Grundlagen aus der projektiven Geometrie stammen.
Verschiedene zweidimensionale Strukturen im Streudiagramm (oben) und in Parallelen Koordinaten (unten).
Verschiedene zweidimensionale Strukturen im Streudiagramm (oben) und in Parallelen Koordinaten (unten).

Zur Visualisierung von hochdimensionalen Daten in der Statistik müssen drei wichtige Aspekte beachtet werden:

die Anordnung der Achsen
Die Anordnung der Achsen ist entscheidend für die Suche nach Strukturen in den Daten. In einer typischen Datenanalyse werden meist viele Anordnungen ausprobiert. Es wurden Anordnungsheuristiken entwickelt, die Einblicke in interessante Strukturen erlauben.[8]
die Rotation der Achsen (Daten)
Da die i-te Koordinate durch die Ecke auf der i-ten Achse bestimmt wird, kann eine Rotation der Achsen (= Rotation der Daten) ein anderes Bild ergeben. Die beiden linken Grafiken können als Rotation der Achsen (oder Daten) um 90 Grad aufgefasst werden. Trotz gleicher Struktur ergeben sich unterschiedliche Strukturen in den parallelen Koordinaten.
die Skalierung der Achsen
Die parallelen Koordinaten sind im Wesentlichen eine Aneinanderreihung von Linien zwischen Paaren von Koordinatenachsen.[6] Daher sollten die Variablen auf einen ähnlichen Maßstab skaliert sein. Verschiedene Skalierungen können ebenfalls interessante Einsichten in die Daten geben.

Literatur

  • Alfred Inselberg: Parallel Coordinates: Visual Multidimensional Geometry and Its Applications. 1. Auflage. Springer, New York 2009, ISBN 978-0-387-21507-5.
  • Martin Graham, Jessie Kennedy: Using Curves to Enhance Parallel Coordinate Visualisations. Napier University, Edinburgh, UK (napier.ac.uk [PDF; abgerufen am 29. September 2011]).
  • Rida E. Moustafa, Edward J. Wegman: On Some Generalization of Parallel Coordinate Plots. George Mason University 2002 (Technical report).

Weblinks

Einzelnachweise

  1. d'Ocagne, Maurice: Coordonnées Parallèles et Axiales: Méthode de transformation géométrique et procédé nouveau de calcul graphique déduits de la considération des coordonnées parallèlles. Paris: Gauthier-Villars, 1885.
  2. Henry Gannett: General Summary Showing the Rank of States by Ratios 1880. (davidrumsey.com).
  3. Alfred Inselberg: The Plane with Parallel Coordinates. In: Visual Computer. 1. Jahrgang, Nr. 4, 1985, S. 69–91, doi:10.1007/BF01898350.
  4. Edward J. Wegman: Hyperdimensional Data Analysis Using Parallel Coordinates. In: Journal of the American Statistical Association. Band 85, Nr. 411, September 1990, S. 664–675.
  5. R. Moustafa, E. Wegman: On Some Generalization to Parallel Coordinate Plot. In: Seeing a million, A Data Visualization Workshop, Rain am Lech (nr.), Germany. 2002.
  6. a b R. Moustafa, E. Wegman: Multivariate continuous data—Parallel Coordinates. In: In: Unwin, A., Theus M., Hofmann, H. (Eds.), Graphics of Large Datasets: Visualizing a Million, Springer. 2006, S. 143–156.
  7. A. Inselberg: Parallel Coordinates: Visual Multidimensional Geometry and its Applications. Springer, 2009.
  8. Interactive Hierarchical Dimension Ordering Spacing and Filtering for Exploration of High Dimensional Datasets (Seiten 3–4; PDF; 6,0 MB)