„Computer Vision“ – Versionsunterschied

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen
[ungesichtete Version][ungesichtete Version]
Inhalt gelöscht Inhalt hinzugefügt
K →‎Was ist Computer Vision?: Formulierung für Verwandschaft zu benachbarten Fächern vereinfacht
K →‎Warum ist Computer Vision so schwer?: Beleg (Quelle) eingefügt
Zeile 12: Zeile 12:
== Warum ist Computer Vision so schwer? ==
== Warum ist Computer Vision so schwer? ==
Die Aufgabenstellungen sind oftmals inverse Probleme, wo versucht wird aus zweidimensionalen Abbildungen die Komplexität der dreidimensionalen Welt wieder herzustellen. Computer Vision versucht aus Bildern Eigenschaften zu rekonstruieren, wie die farbliche Gestalt, die Beleuchtung oder deren Form, und darauf basierend versucht man z.B. Gesichter zu erkennen, landwirtschaftliche Flächen zu klassifizieren oder komplexe Objekte zu erkennen (PKW, Fahrrad, Fussgänger). All das gelingt einem Menschen scheinbar spielerisch, es ist aber extrem schwer dies einem Computer beizubringen.
Die Aufgabenstellungen sind oftmals inverse Probleme, wo versucht wird aus zweidimensionalen Abbildungen die Komplexität der dreidimensionalen Welt wieder herzustellen. Computer Vision versucht aus Bildern Eigenschaften zu rekonstruieren, wie die farbliche Gestalt, die Beleuchtung oder deren Form, und darauf basierend versucht man z.B. Gesichter zu erkennen, landwirtschaftliche Flächen zu klassifizieren oder komplexe Objekte zu erkennen (PKW, Fahrrad, Fussgänger). All das gelingt einem Menschen scheinbar spielerisch, es ist aber extrem schwer dies einem Computer beizubringen.

Der Versuch unsere sichtbare Welt in all seiner Gesamtheit modellieren zu wollen, ist bei weitem schwerer, als beispielsweise eine Computer-generierte künstliche Stimme zu erzeugen (Szeliski 2010, S. 3). Dies wird von Wissenschaftlern, die nicht in diesem Gebiet arbeiten, oft unterschätzt, wie schwierig die Probleme sind und wie fehleranfällig deren Lösungen teilweise sind. Das führt einerseits dazu, dass man für Problemstellungen oft maßgeschneiderte Lösungen braucht. Andererseits wird dadurch jedoch deren Vielseitigkeit stark beschränkt. Unter anderem aus diesem Grunde gibt es für keine Aufgabenstellung nur eine Lösung sondern viele verschiedene Lösungen je nach den Anforderungen. Das erklärt auch, warum so viele konkurrierende Lösungswege in der Fachwelt existieren.
Der Versuch unsere sichtbare Welt in all seiner Gesamtheit modellieren zu wollen, ist bei weitem schwerer, als beispielsweise eine Computer-generierte künstliche Stimme zu erzeugen (Szeliski 2010, S. 3).<ref>{{Literatur |Autor=Richard Szeliski |Titel=Computer Vision |Verlag=Springer London |Ort=London |Datum=2011 |Reihe=Texts in Computer Science |ISBN=978-1-84882-934-3 |DOI=10.1007/978-1-84882-935-0 |Online=http://link.springer.com/10.1007/978-1-84882-935-0 |Abruf=2020-05-25}}</ref> Dies wird von Wissenschaftlern, die nicht in diesem Gebiet arbeiten, oft unterschätzt, wie schwierig die Probleme sind und wie fehleranfällig darum deren Lösungen teilweise sind. Das führt einerseits dazu, dass man für Problemstellungen oft maßgeschneiderte Lösungen braucht. Andererseits wird dadurch jedoch deren Vielseitigkeit stark beschränkt. Unter anderem aus diesem Grunde gibt es für keine Aufgabenstellung nur eine Lösung sondern viele verschiedene Lösungen je nach den Anforderungen. Das erklärt auch, warum so viele konkurrierende Lösungswege in der Fachwelt existieren.

Version vom 25. Mai 2020, 21:38 Uhr

Diese Baustelle befindet sich fälschlicherweise im Artikelnamensraum. Bitte verschiebe die Seite oder entferne den Baustein {{Baustelle}}.
Hinweis: Du darfst diese Seite editieren!
Ja, wirklich. Es ist schön, wenn jemand vorbeikommt und Fehler oder Links korrigiert und diese Seite verbessert. Sollten deine Änderungen aber anderen nicht gefallen, sei bitte nicht traurig oder verärgert, wenn sie rückgängig gemacht werden.
Wikipedia ist ein Wiki, sei mutig!

Was ist Computer Vision?

Computer Vision ist eine Wissenschaft im Grenzbereich zwischen Informatik und den Ingenieurswissenschaften und versucht die von Kameras aufgenommenen Bilder auf unterschiedlichste Art und Weise zu verarbeiten und zu analysieren um deren Inhalt zu verstehen oder geometrische Informationen zu entlocken. Anwendungsgebiete sind z.B. die autonome Navigation von Robotern (Fahrerassistenzsysteme), die Filmindustrie zur Erschaffung virtueller Welten (virtual reality), die Spieleindustrie zum Eintauchen und Interagieren in virtuellen Räumen (augmented reality), die Erkennung und Verfolgung von Objekten (z.B. Fußgänger) oder zur Registrierung von medizinischen CT-Aufnahmen und Erkennung von krankem Gewebe usw. Dabei kommen statistische (bzw. probabilistische) Methoden zum Einsatz, Methoden der Bildverarbeitung, der projektiven Geometrie, aus der Künstlichen Intelligenz und der Computergrafik. Darüber hinaus besteht eine enge Verwandschaft zu benachbarten Fachgebieten, wie die Photogrammetrie, die Fernerkundung und die Kartografie.

Für die Einleitung verwendete Literatur:

  • "COMPUTER VISION - A MODERN APPROACH", Forsyth, Ponce, 2nd Edition, 2012, Pearson Education (Prentice Hall), USA, New Jersey, ISBN-13: 978-0-13-608592-8 (ISBN-10: 0-13-608592-X)
  • "Concise Computer Vision - An Introduction into Theory and Algorithms", Reinhard Klette, Springer-Verlag London 2014, ISBN 978-1-4471-6320-6 (eBook), ISBN 978-1-4471-6319-0, DOI 10.1007/978-1-4471-6320-6
  • "Computer Vision - Algorithms and Applications", Richard Szeliski, Springer-Verlag London Limited 2011, ISBN 978-1-84882-934-3, e-ISBN 978-1-84882-935-0, DOI 10.1007/978-1-84882-935-0, http://szeliski.org/Book

Warum ist Computer Vision so schwer?

Die Aufgabenstellungen sind oftmals inverse Probleme, wo versucht wird aus zweidimensionalen Abbildungen die Komplexität der dreidimensionalen Welt wieder herzustellen. Computer Vision versucht aus Bildern Eigenschaften zu rekonstruieren, wie die farbliche Gestalt, die Beleuchtung oder deren Form, und darauf basierend versucht man z.B. Gesichter zu erkennen, landwirtschaftliche Flächen zu klassifizieren oder komplexe Objekte zu erkennen (PKW, Fahrrad, Fussgänger). All das gelingt einem Menschen scheinbar spielerisch, es ist aber extrem schwer dies einem Computer beizubringen.

Der Versuch unsere sichtbare Welt in all seiner Gesamtheit modellieren zu wollen, ist bei weitem schwerer, als beispielsweise eine Computer-generierte künstliche Stimme zu erzeugen (Szeliski 2010, S. 3).[1] Dies wird von Wissenschaftlern, die nicht in diesem Gebiet arbeiten, oft unterschätzt, wie schwierig die Probleme sind und wie fehleranfällig darum deren Lösungen teilweise sind. Das führt einerseits dazu, dass man für Problemstellungen oft maßgeschneiderte Lösungen braucht. Andererseits wird dadurch jedoch deren Vielseitigkeit stark beschränkt. Unter anderem aus diesem Grunde gibt es für keine Aufgabenstellung nur eine Lösung sondern viele verschiedene Lösungen je nach den Anforderungen. Das erklärt auch, warum so viele konkurrierende Lösungswege in der Fachwelt existieren.

  1. Richard Szeliski: Computer Vision (= Texts in Computer Science). Springer London, London 2011, ISBN 978-1-84882-934-3, doi:10.1007/978-1-84882-935-0 (springer.com [abgerufen am 25. Mai 2020]).