Visuelle Wahrnehmung

aus Wikipedia, der freien Enzyklopädie
(Weitergeleitet von Visuell)
Wechseln zu: Navigation, Suche
Mögliches Piktogramm für Visuelle Wahrnehmung

In der Physiologie ist visuelle Wahrnehmung die Aufnahme und Verarbeitung von visuellen Reizen, bei der über Auge und Gehirn eine Extraktion relevanter Informationen, Erkennung von Elementen und deren Interpretation durch Abgleich mit Erinnerungen stattfindet. Somit geht die visuelle Wahrnehmung weit über das reine Aufnehmen von Information hinaus.

Physiologische Einzelheiten zum Wahrnehmungsapparat finden sich unter visuelles System.

Geschichte[Bearbeiten]

Im Altertum existierten unterschiedliche Theorien über die visuelle Wahrnehmung:

Die Wahrnehmungstheorie von Euklid (365–300 v. Chr.) setzte sich mit Problemen der Raumwahrnehmung (z. B. Perspektive und Größenkonstanz) auseinander. Die Sehlinien gehen nach dieser Theorie vom Auge aus und bestimmen die Wahrnehmung. Diese Theorie des „Sehstrahls“ scheint im Lichte physikalischer Betrachtungen ziemlich absurd zu sein, erhält aber durch die modernen Erkenntnisse der Blickbewegungsanalysen eine Art späte Rehabilitation (siehe foveale Wahrnehmung).

Die Wahrnehmungstheorie von Empedokles (492–432 v. Chr.) besagte scheinbar das Gegenteil. Die von den Poren (heute würde man sagen Pigmente) der Dinge ausgehenden Einflüsse, eine Art von Strahlungen, die durch das Licht beeinflusst werden (heute würde man umgekehrt sagen, das Licht wird reflektiert), dringen in die Sinnesorgane ein, und werden wahrgenommen, wenn sie dort eine Entsprechung finden (Gleiches wird durch Gleiches erkannt). Auch diese Theorie, die sich mit dem Erkennen von Dingen der Außenwelt befasst, ist in ihrem Ansatz moderner als es scheint. Sie bezieht sich aus heutiger Sicht auf die periphere Wahrnehmung, die ja auch auf den Betrachter einwirkt, selbst wenn dieser gar nicht hinschaut.

Leonardo da Vinci: „Das Auge hat eine einzige Zentrallinie, und alle Dinge, welche durch diese Linie zum Auge gelangen, werden gut gesehen.“

Alhazen oder Ibn al-Haytham, der „Vater der Optik“ (965–1040), bewies als Erster, dass die visuelle Wahrnehmung mit dem Licht zusammenhängt, das ins Auge fällt. Er stellte als Erster die Hypothese auf, dass die Sehwahrnehmung im Gehirn und nicht im Auge stattfindet.

Durch Versuche wies er nach, dass die Wahrnehmung durch die persönliche Erfahrung eines Menschen beeinflusst wird.[1] Al-Haytham führte Experimente über menschliche Wahrnehmung durch und ergänzte die Arbeiten des Ptolemäus über stereoskopisches Sehen.[2][3]

Leonardo da Vinci (1452–1519) erkannte als Erster die optische Besonderheit des menschlichen Auges. Er schrieb: „Das Auge hat eine einzige Zentrallinie, und alle Dinge, welche durch diese Linie zum Auge gelangen, werden gut gesehen. Um diese Linie gibt es eine unendlich große Anzahl anderer Linien, die mit der Zentrallinie in Berührung kommen und die umso wirkungsloser sind, je weiter sie von besagter Zentrallinie entfernt sind.“[4]

Zu dieser Ansicht gelangte Leonardo durch Beobachtungen und mit Hilfe von optischen Experimenten. "Das Auge, von welchem uns die Erfahrung so deutlich die Funktion offenbart, wurde von einer unendlich großen Anzahl von Autoren in einer bestimmten Weise beschrieben; ich aber finde, dass es ganz anders ist.“ Damit ist er der Entdecker des Unterschieds zwischen fovealem und peripherem Sehen.[5]

Hermann von Helmholtz[6] wird oft als Vater der modernen visuellen Wahrnehmungstheorie betrachtet. Er verglich das Auge mit optischen Geräten und fand seine Konstruktionsmerkmale sehr primitiv. Theoretisch konnte das Auge gar keine brauchbaren Sehresultate liefern. Er schloss daraus, dass die Wahrnehmung nur durch „unbewusste Schlüsse“ zustande kommen könne, die durch bereits vorhandene Wahrnehmungserfahrungen ermöglicht werden.

Solche Wahrnehmungserfahrungen sind z. B.:

  • Licht kommt gewöhnlich von oben (immer präsentes Licht, die Sonne, steht höher als der Betrachter)
  • Gegenstände werden nicht von unten gesehen, da die allgemeine Blickrichtung horizontal erfolgt
  • Gesichter werden in aufrechter Position erkannt[7]
  • Es gibt keine gleichen doppelten Schattenwürfe bei Beleuchtung mit einer Lichtquelle (Sonne!)
  • In freier Natur ist die hellste Lichtquelle stets die Sonne. Alle lichtabhängigen Wahrnehmungserfahrungen beruhen auf der Wirkung der Sonne als Lichtquelle und durch ihre Position im Raum. Die Sonne ist die Lichtquelle, die Lebewesen auf der Erde ihr ganzes Leben begleitet

Es gibt nur einen Lichtreflex auf einem Augapfel, der bei natürlicher Beleuchtung stets rund ist (wg. einer Sonne, die zudem rund ist)

Anmerkung: Wahrnehmungserfahrungen spielen in der Fotografie (und ebenso bei Filmaufzeichnungen) eine wichtige Rolle: Folgt eine Beleuchtung oder Darstellung nicht allgemeinen Wahrnehmungserfahrungen wird das Bild als "unnatürlich" oder "falsch" bezeichnet (unbeschadet des Vorgehens zur Erreichung besonderer Effekte)

Das Studium der optischen Täuschungen hat gezeigt, welche unbewussten Schlüsse im Wahrnehmungsvorgang enthalten sein können.

Eine andere Art unbewusster Schlüsse basiert auf der Wahrscheinlichkeitsempfindung, welche durch die Häufigkeit bereits gemachter ähnlicher Wahrnehmung bestimmt wird.[8]

Wahrnehmungsprozess[Bearbeiten]

Reizaufnahme[Bearbeiten]

Durch den dioptrischen Apparat des Auges wird auf der Netzhaut ein seitenverkehrtes und auf dem Kopf stehendes Bild erzeugt. Die Lichtreize werden von den Sinneszellen der Retina, den Stäbchen (Helligkeit) und Zapfen (Farbsehen), registriert. Das Verhältnis der Zelltypen unterscheidet sich je nach Ort auf der Netzhaut; in der Fovea befinden sich ausschließlich Zapfen. Zapfen und Stäbchen bilden bei Lichteinfall ein Membranpotential, das über bipolare Zellen an Ganglienzellen weitergeleitet wird.

Weiterleitung und Encodierung[Bearbeiten]

Jede Ganglienzelle verarbeitet Informationen aus einem rezeptiven Feld (einem räumlich begrenzten Bereich der Retina). Es gibt zwei Haupttypen von Ganglienzellen, On- und Off-Center-Zellen, welche vor allem bei der Kantendetektion eine wichtige Rolle spielen. On-Center-Zellen sprechen an, wenn Licht in das Zentrum des rezeptiven Feldes fällt, und senken ihre Feuerrate, wenn periphere Bereiche des Feldes stärker belichtet werden. Off-Center-Zellen verhalten sich genau andersherum und feuern verstärkt, wenn Lichtreize in Randbereichen des rezeptiven Feldes aufgenommen werden.

Die Informationen von den Ganglienzellen werden über die Sehbahn zum linken und rechten seitlichen Kniehöcker geleitet. Der Output der On- und Off-Center-Zellen wird in den seitlichen Kniehöckern so verschaltet, dass Kanten (also Bereiche, in denen ein Helligkeitswechsel stattfindet) oder Balken (Helligkeitswechsel und Rückkehr zur Ausgangsintensität) extrahiert werden. Die aufbereiteten Informationen werden von den seitlichen Kniehöckern auf den visuellen Cortex projiziert. Diese Aufbereitung der Signale umfasst auch eine Steigerung des Kontrastempfindens über Rückkopplungsvorgänge, welche dafür sorgen, dass gleichzeitig zur Kontrastverstärkung die hohe Lichtempfindlichkeit gewahrt bleibt[9].

Interpretation[Bearbeiten]

Raumwahrnehmung[Bearbeiten]

Die Raumwahrnehmung stützt sich auf mehrere Verfahren, um aus dem zweidimensionalen Bild auf der Netzhaut eine Repräsentation der dreidimensionalen Welt zu erstellen. Durch das stereoskope Sehen können Rauminformationen aus den leichten Unterschieden zwischen den vom Augenpaar aufgenommenen Bildern konstruiert werden. Bewegt sich der Betrachter relativ zu Gegenständen im Raum, so bewegen sich die Abbilder auf der Netzhaut umso langsamer, je weiter der Gegenstand vom Betrachter entfernt ist. Daneben kann räumliche Wahrnehmung über den Texturgradienten stattfinden, d.h. über die Veränderungen der Textur je nach räumlichem Abstand.

Objektextraktion[Bearbeiten]

Bevor Objekte erkannt und interpretiert werden können, muss erst aus den Informationen extrahiert werden, wo sich Objekte befinden und welche der erkannten Linien zu einem Objekt gehören. Diese Gestaltheuristiken (auch Gestaltprinzipien; der historische Begriff Gestaltgesetze sollte allerdings vermieden werden) funktionieren alle nach dem Prinzip eine möglichst prägnante Lösung zu finden (Gestaltpsychologie):

  • Prägnanz: Eine Figur wird so wahrgenommen, dass sie einer möglichst einfachen Struktur entspricht
  • Nähe: Bildelemente werden als zusammengehörig empfunden, wenn diese nahe beieinanderliegen
  • Ähnlichkeit: Bildteile gleicher Form oder Farbe werden als Ganzes gesehen
  • Symmetrie: symmetrische Strukturen werden dem gleichen Objekt zugeordnet
  • Gemeinsame Bewegung (Common fate): Gleiche Bewegungen und gleichzeitiges Erscheinen oder Verschwinden von Bildelementen erzeugt eine Zusammengehörigkeit
  • Kontinuität: Bildelemente, die eine Fortsetzung vorangehender oder unterbrochener Elemente zu sein scheinen, werden als zusammengehörig angesehen
  • Geschlossenheit: Linien, die eine Fläche umschließen, werden unter sonst gleichen Umständen leichter als eine Einheit aufgefasst als diejenigen, die sich nicht zusammenschließen
  • Gemeinsame Region: Elemente in abgegrenzten Gebieten werden als zusammengehörig empfunden
  • Verbundene Elemente: Verbundene Elemente werden als ein Objekt wahrgenommen

Objekterkennung[Bearbeiten]

In der Objekterkennung werden die extrahierten Objekte interpretiert und können mit Erinnerungen abgeglichen werden.

Abgleich an Merkmalen[Bearbeiten]

Ein Objekt kann mit einer bestehenden Erinnerung durch eine Merkmalanalyse abgeglichen werden. In diesem Modell wird vorausgesetzt, dass eine Form oder ein Objekt in einen Satz abstrakter Merkmale repräsentiert wird. Der Buchstabe K hat z. B. die Merkmale „langer senkrechter Strich“ „kürzerer Strich mit ca. 30° Neigung“ und „kürzerer Strich mit ca 75° Neigung“. Dieses Modell ist dem eines Schablonenabgleichs dadurch überlegen, dass auch abgeänderte Muster erkannt werden. Beim „K“ können Größe, Lage, Rotation oder Schriftart geändert werden, sodass eine „Schablone“ nicht mehr passen würde. Unter all diesen Transformationen bleiben die Merkmale jedoch gleich. Zudem entspricht der Merkmalsabgleich der Encodierung durch die Ganglionzellen (Extraktion von Linien)[10].

Erkennung komplexer Objekte[Bearbeiten]

Zur Erkennung komplexer Objekte existiert die „Theorie der volumetrischen Erkennung“[11]

  • Das komplexe Objekt wird in einfachere (dreidimensionale) Komponenten gegliedert, und jede Komponente einem „Geon“ (von: „Geometrical Icon“) zugeordnet. Geons sind ein Satz einfacher, dreidimensionaler Objekte, aus denen man durch Kombination komplexere Objekte erzeugen kann.
  • Sind die Unterobjekte (= Geons) erkannt und deren Anordnung zueinander bestimmt, kann das (Gesamt-)Objekt zugeordnet werden.

Bei der Zuordnung findet das eigentliche Erkennen statt. Das Objekt wird eingeordnet und repräsentiert dann ein Objekt einer Kategorie (wie z. B. Zuordnung als „Hund“ oder „Telefon“)

Gesichtswahrnehmung[Bearbeiten]

Das Erkennen von Gesichtern zählt zu den wichtigsten sozialen Wahrnehmungsleistungen des Menschen. Gesichter müssen im Gegensatz zu vielen Alltagsobjekten singulär identifiziert werden und sind daher eine besondere Art von Wahrnehmungsschemata. Zur Gesichtserkennung dient aber nicht nur die Einprägung von konkreten Merkmalen (z. B.: Größe der Nase), sondern auch von deren Relationen (z. B.: Augenabstand).

Wie wichtig die Konfiguration von Merkmalen ist, konnten Leder und Bruce (2000) belegen. Probanden sollten sich verschiedene Gesichter einprägen und wurden danach abgeprüft. Dabei wurden ihnen die Bilder sowohl aufrecht als auch auf dem Kopf stehend gezeigt. In dieser umgekehrten Position waren es vor allem die Relationen zwischen den Merkmalen, die es den Probanden ermöglichten, die Gesichter zu erkennen.

Wie bereits aus der Gehirnforschung bekannt ist, ist bei Verletzung oder Schädigung bestimmter Kortexareale die Identifikation von bekannten Gesichtern nicht mehr möglich (Prosopagnosie). Dies legt die Theorie nahe, dass die Wahrnehmung von Gesichtern wohl durch spezialisierte Kortexfelder unterstützt wird.[12]

Beispiele für Untersuchung der visuellen Wahrnehmung[Bearbeiten]

Die ersten zwei Sekunden bei der Betrachtung eines Bildes

In den Jahren nach 1960 wurden vermehrt Blickbewegungen aufgezeichnet und analysiert, z. B. beim Lesen von Texten[13] bei der Bildbetrachtung[14] und später auch beim Lösen visueller Probleme[15] und beim Autofahren.[16] Das Bild links zeigt, was in den ersten 2 Sekunden der Betrachtung eines Bildes geschehen kann. Der Hintergrund ist durch peripheres Sehen unscharf. Trotzdem kann man erkennen, dass es sich um eine Szene in einem Zimmer mit Personen handelt. Die erste Augenfixation zeigt ein paar Männerschuhe, vielleicht weil diese einen starken Kontrast aufweisen und außerdem sehr nahe bei der Grundposition der Augenfixationen liegen. Alle folgenden Fixationen springen von Gesicht zu Gesicht.

Man kann daraus schließen, dass das menschliche Gesicht im Normalfall die meiste Beachtung erhält, weil es eine Identifikation oder eine Beurteilung einer Person auf Grund biometrischer Ähnlichkeiten ermöglicht und so bereits eine erste Beurteilung einer zwischenmenschlichen Situation gestattet.

Eine wesentliche Tatsache: Die menschliche Wahrnehmung ist heuristisch und nicht linear, d. h. es werden diejenigen Teile eines Bildes betrachtet, die zusätzliche Informationen enthalten, während subjektiv unwichtige oder bereits gut bekannte Bildelemente nicht fixiert werden (zusätzliche Beispiele siehe Blickbewegungsregistrierung).

Auf rechnerischer Ebene wurde von David Marr in den 1980er Jahren eine Theorie der Verarbeitung der Seheindrücke zur visuellen Wahrnehmung im Gehirn erstellt, die im Bereich der künstlichen Intelligenz ihre Anwendung findet. Diese Theorie wurde niemals experimentell überprüft.

Neurophysiologische Theorie[Bearbeiten]

Eine neurophysiologisch orientierte Theorie der visuellen Wahrnehmung ist exemplarisch im Artikel Wahrnehmung dargestellt.

Verwandte Gebiete[Bearbeiten]

Siehe auch[Bearbeiten]

Literatur[Bearbeiten]

Quellen[Bearbeiten]

  1. Bradley Steffens (2006). Ibn al-Haytham: First Scientist, Chapter 5. Morgan Reynolds Publishing. ISBN 1-59935-024-6.
  2. Howard, I: Alhazen’s neglected discoveries of visual phenomena. In: Perception. 25, 1996, S. 1203-1217. doi:10.1068/p251203.
  3. Omar Khaleefa: Who Is the Founder of Psychophysics and Experimental Psychology?. In: American Journal of Islamic Social Sciences. 16, Nr. 2, 1999.
  4. Quaderni d’anatomia IV fol. 12 verso, zitiert in Sandro Piantanida, Costantino Baroni (ed.), Kurt Karl Eberlein (Übersetzung): Leonardo da Vinci – Das Lebensbild eines Genies". Dokumentation der Leonardo-da-Vinci-Ausstellung in Mailand 1938. Lüttke-Verlag Berlin o.J. (1939/40). Nachdruck Emil Vollmer Verlag 1955. S. 430 http://books.google.de/books?id=qHASAQAAMAAJ&q=wirkungsloser
  5. Hans-Werner Hunziker, (2006) Im Auge des Lesers: foveale und periphere Wahrnehmung – vom Buchstabieren zur Lesefreude, Transmedia Stäubli Verlag Zürich 2006 ISBN 978-3-7266-0068-6
  6. Handbuch der physiologischen Optik / Bd. 1. Die Dioptrik des Auges 1909, 3. Aufl. / erg. u. hrsg. in Gemeinsch. mit A. Gullstrand; J. von Kries v. W. Nagel
  7. Hans-Werner Hunziker, (2006) Im Auge des Lesers: foveale und periphere Wahrnehmung – vom Buchstabieren zur Lesefreude, Transmedia Stäubli Verlag Zürich 2006 ISBN 978-3-7266-0068-6
  8. Mamassian, Landy & Maloney (2002): A Primer on Probabilistic Approaches to Visual Perception
  9. Autorenkürzel hrb: Bildverarbeitung: Wie das Auge Signale verstärkt (DE, HTML) Spiegel Online. 4. Mai 2011. Abgerufen am 5. Mai 2011.
  10. John R. Anderson:Kognitive Psychologie, ISBN 978-3-8274-1024-5
  11. Biederman: Recognition-by-Components:A Theory of Human Image http://geon.usc.edu/~biederman/publications/Biederman_RBC_1987.pdf
  12. Maderthaner, R. (2008). Psychologie. ISBN 978-3-8252-2772-2.
  13. TAYLOR, ST.: Eye Movements in Reading: Facts and Fallacies. American Educational Research Association, 2 (4), 1965, 187–202.
  14. Yarbus, A. L. (1967). Eye movements and vision, Plenum Press, New York
  15. Hunziker, H. W. (1970). Visuelle Informationsaufnahme und Intelligenz: Eine Untersuchung über die Augenfixationen beim Problemlösen. Schweizerische Zeitschrift für Psychologie und ihre Anwendungen, 1970, 29, Nr 1/2
  16. Cohen, A. S. (1983). Informationsaufnahme beim Befahren von Kurven, Psychologie für die Praxis 2/83, Bulletin der Schweizerischen Stiftung für Angewandte Psychologie