Maschinelles Sehen

aus Wikipedia, der freien Enzyklopädie
Zur Navigation springen Zur Suche springen
Die Artikel Computer Vision und Maschinelles Sehen überschneiden sich thematisch. Hilf mit, die Artikel besser voneinander abzugrenzen oder zusammenzuführen (→ Anleitung). Beteilige dich dazu an der betreffenden Redundanzdiskussion. Bitte entferne diesen Baustein erst nach vollständiger Abarbeitung der Redundanz und vergiss nicht, den betreffenden Eintrag auf der Redundanzdiskussionsseite mit {{Erledigt|1=~~~~}} zu markieren. Wienerschmäh Wels wappen.jpg Disk 12:26, 3. Jun. 2020 (CEST)


Maschinelles Sehen (Englisch: machine vision) umfasst alle industriellen Anwendungen, bei der, basierend auf visuellen Systemen, automatisierte Prozesse gelenkt werden. Typische Einsatzgebiete sind industrielle Herstellungsprozesse, die Automatisierungstechnik und die Qualitätssicherung. Weitere Einsatzgebiete finden sich z. B. in der Verkehrstechnik – von der einfachen Radarfalle bis hin zum „sehenden Fahrzeug“ – und in der Sicherheitstechnik (Zutrittskontrolle, automatische Erkennung von Gefahrensituationen). Dabei werden Methoden aus dem Fachgebiet Computer Vision eingesetzt.

Oftmals wird Computer Vision mit dem maschinellem Sehen gleichgesetzt. Obwohl hier Technologien und Methoden aus dem Gebiet Computer Vision zum Einsatz kommen, unterscheiden sie sich in den Anforderungen, welche sich im speziellen industriellem Umfeld ergeben. Industrielle visuelle Systeme erfordern eine hohe Zuverlässigkeit, Stabilität und müssen besonders robust sein. Insofern versucht maschinelles Sehen existierende Technologien auf neue Art und Weise anzuwenden und zu integrieren.[1][2]

Aufgabenstellungen[Bearbeiten | Quelltext bearbeiten]

Folgende Aufgabenstellungen können derzeit wirtschaftlich sinnvoll gelöst werden:

Forschung[Bearbeiten | Quelltext bearbeiten]

Nur ein vergleichsweise kleiner Teil der aktuellen Forschungsprojekte beschäftigt sich damit, tatsächlich den Sinn oder den Inhalt von Bildern zu verstehen; meistens geht es eher darum, in Bildern Objekte zu detektieren, sie zu beschreiben, ihre Eigenschaften zu vermessen, sie zu klassifizieren, und auf Grund dieser Ergebnisse Entscheidungen zu treffen oder Prozesse zu steuern. Maschinelles Sehen verwendet Methoden aus dem Gebiet Computer Vision und ist somit ein Teilgebiet der Informatik, das starke Querbeziehungen zu Photogrammetrie, Signalverarbeitung und künstlicher Intelligenz aufweist. Die Werkzeuge des Maschinensehens stammen meistens aus der Mathematik, insbesondere aus Geometrie, linearer Algebra, Statistik, Operations Research (Optimierung) und Funktionalanalysis. Typische Aufgaben des Maschinensehens sind die Objekterkennung und die Vermessung der geometrischen Struktur von Objekten sowie von Bewegungen (Fremdbewegung, Eigenbewegung). Dabei wird auf Algorithmen aus der Bildverarbeitung zurückgegriffen, zum Beispiel die Segmentierung und auf Verfahren der Mustererkennung, beispielsweise zur Klassifizierung von Objekten.

Methoden[Bearbeiten | Quelltext bearbeiten]

Werkzeuge der Bildverarbeitung zur automatischen Interpretation sind:

In komplexeren Erkennungsaufgaben werden oft Modelle eingesetzt. Diese beinhalten Vorwissen, das zur Erkennung eines Gegenstandes benutzt werden kann. Beispielsweise beschreibt ein Gesichtsmodell, dass sich die Nase immer zwischen dem Mund und den Augen befinden muss. Somit weiß ein Suchalgorithmus ungefähr, wo er den Mund suchen muss, wenn er Augen und Nase schon gefunden hat. Hier einige Modelltechniken:

Entwicklungen[Bearbeiten | Quelltext bearbeiten]

2001 entwickelten zwei Informatiker die nach ihnen benannte Viola-Jones-Methode zur Gesichtserkennung. Das Verfahren beruht auf maschinellem Lernen und ist weit verbreitet.

Die oben beschriebenen Methoden ermitteln Eigenschaften und Werte aus Bildern und ordnen sie den darin enthaltenen Objekten zu. Dies beruht auf der deduktiven Anwendung von bekannten Regeln. Eine Erweiterung ist das maschinelle Lernen. Es nutzt induktive Methoden, um diese Regeln überhaupt erst zu finden. Beim überwachten Lernen wird etwa einer hinreichend großen Menge von Bildern jeweils einer Klasse zugeordnet. Nach dieser Lernphase kann dann die implizit vorhandene Regel oder Gesetzmässigkeit zur Klassifizierung neuer Bilder angewendet werden. Beispiele für industrielle Anwendungen ist die Zeichen- und Schrifterkennung (optical character recognition, LeCun), das auf der Anwendung neuronaler Netze beruht.

Anwendungen[Bearbeiten | Quelltext bearbeiten]

In industriellen Umgebungen werden die Techniken des maschinellen Sehens heutzutage erfolgreich eingesetzt. Computer unterstützen beispielsweise die Qualitätskontrolle und vermessen einfache Gegenstände. Weitgehend bestimmt der Programmierer hier die Umgebungsbedingungen, die wichtig für ein fehlerfreies Ablaufen seiner Algorithmen sind (Kameraposition, Beleuchtung, Geschwindigkeit des Fließbandes, Lage der Objekte usw.).

Beispiele für den Einsatz in industriellen Umgebungen sind:

In natürlichen Umgebungen werden weit schwierigere Anforderungen an die Techniken des maschinellen Sehens gestellt. Hier hat der Programmierer keinen Einfluss auf die Umgebungsbedingungen, was die Erstellung eines robusten, fehlerfrei ablaufenden Programms erheblich erschwert. Man kann sich dieses Problem anhand eines Beispiels zur Erkennung von Automobilen verdeutlichen: Ein schwarzes Auto hebt sich vor einer weißen Wand gut ab, der Kontrast zwischen einem grünen Auto und einer Wiese ist allerdings sehr gering und eine Unterscheidung nicht einfach.

Beispiele für den Einsatz in natürlichen Umgebungen sind:

  • automatische Erkennung der Fahrbahn und von Fußgängern am Straßenrand
  • Erkennung von menschlichen Gesichtern und deren Mimik
  • Erkennung von Personen und deren Tätigkeit

Weitere Anwendungen finden sich in einer Vielzahl unterschiedlicher Bereiche:

Aufgaben[Bearbeiten | Quelltext bearbeiten]

Systeme Maschinellen Sehens sind zusätzliche Investitionen einer Produktion. Gegen diese Kosten rechnet man die Vorteile, die in folgenden Potenzialen liegen:

  • höheres Qualitätsniveau
  • Analyse von Störgrößen und Prozessverbesserung
  • weniger Ausschuss
  • Absicherung der Lieferantenkette
  • Überwachung hochdynamischer Produktionsprozesse
  • Kostenoptimierung.

Siehe auch[Bearbeiten | Quelltext bearbeiten]

Literatur[Bearbeiten | Quelltext bearbeiten]

  • Carsten Steger, Markus Ulrich, Christian Wiedemann: Machine Vision Algorithms and Applications. 2. Auflage. Wiley-VCH, Weinheim 2018, ISBN 978-3-527-41365-2. Link
  • Gottfried Gerstbach: Auge und Sehen – der lange Weg zu digitalem Erkennen. Sternenbote Heft 43/8, p. 142–157, Wien 2000.

Weblinks[Bearbeiten | Quelltext bearbeiten]

Einzelnachweise[Bearbeiten | Quelltext bearbeiten]

  1. What is Machine Vision | Cognex. Abgerufen am 11. Juni 2020.
  2. Vision Online. Abgerufen am 11. Juni 2020 (englisch).