Fast jeder Mensch kann Objekte mit wenigen Strichen darstellen. Kindergartenkinder präsentieren oft selbstgemalte Bilder von Mama, Papa oder dem eigenen Zuhause. Vor Tausenden von Jahren malten unsere Vorfahren Tiere und andere Objekte mit Strichen an Höhlenwände. Doch wie erkennen wir diese Objekte als Haus oder Tier, obwohl sich Strichzeichnungen stark von realen Objekten unterscheiden? Sie sind oft farblos, stark vereinfacht und haben manchmal eine ganz andere Form.
Die Wahrnehmung von Strichzeichnungen im Gehirn
Wissenschaftler am MPI CBS in Leipzig, in Zusammenarbeit mit der Freien Universität Berlin und der Justus-Liebig-Universität Gießen, haben untersucht, wie sich unsere Wahrnehmung von Strichzeichnungen von natürlichen Bildern unterscheidet. Sie zeigten Versuchsteilnehmern Bilder von Objekten wie Hunden oder Autos in drei Varianten: als normales Foto, als detaillierte Strichzeichnung und als schnell gekritzeltes Bild. Währenddessen wurde ihre Hirnaktivität mit funktioneller Magnetresonanztomographie und Magnetenzephalographie aufgezeichnet.
Johannes Singer, Erstautor der Studie, erklärt: “Durch die Verwendung dieser beiden Messmethoden konnten wir die Hirnregionen bestimmen, die an der Wahrnehmung von Objekten beteiligt sind und auch den zeitlichen Verlauf der Hirnaktivitätsveränderung auf die Millisekunde genau messen. Wir konnten also dem Gehirn genau bei der Arbeit zuschauen, während es Bilder von Objekten als Fotos und als Strichzeichnungen verarbeitete.”
Die Forscher hatten zwei Vermutungen:
- Hypothese 1: Unser Gehirn nimmt Objekte als Strichzeichnungen anders wahr und greift auf zusätzliche Verarbeitungsschritte zurück. Die Strichzeichnung eines Hundes müsste im Gehirn eine "Extrarunde" drehen, bevor sie erkannt wird.
- Hypothese 2: Unser Gehirn ist flexibel genug, um einen Hund auch dann zu erkennen, wenn es sich nur um ein paar Striche handelt.
Die Ergebnisse zeigten, dass die Hirnsignale für die Wahrnehmung von Zeichnungen denen für Fotos von Objekten sehr ähnlich waren. Das bedeutet, dass unser Gehirn Strichzeichnungen automatisch verarbeiten kann.
Lesen Sie auch: Gleichgewicht und das Kleinhirn
Martin Hebart, Leiter der Studie, betont: “Diese Ergebnisse sind nicht nur interessant für unser Verständnis davon, wie wir Strichzeichnungen wahrnehmen. Wir wissen jetzt auch, dass unsere Wahrnehmung von Objekten wirklich besonders robust gegenüber Veränderungen in unserer Umwelt ist.” Unser Gehirn erleichtert es uns also, Objekte als Strichzeichnungen zu erkennen. Selbst wenn man nicht gut zeichnen kann, hilft das Gehirn beim Erkennen.
Die Rolle von Objekten und Substanzen in der visuellen Verarbeitung
Für ein weiteres Experiment erstellten Paulun und ihre Kollegen 100 kurze Videoclips, in denen harte oder elastische Bälle, Flüssigkeiten oder Pulver in verschiedenen Aktionen zu sehen waren. Die Analysen zeigten, dass die beiden Hirn-Netzwerke LOC (lateraler Okzipitalkomplex) und FPN (frontoparietales Netzwerk) sowohl auf Objekte als auch auf Substanzen reagieren. Der laterale Okzipitalkomplex verarbeitet nicht nur die 3D-Form fester Gegenstände, sondern auch die Formveränderungen flüssiger oder körniger Substanzen. Interessanterweise geschieht diese Verarbeitung in jeweils eigenen Unter-Arealen der beiden Netzwerke.
„Beide Signalwege haben eine Zweiteilung: Ein Unterbereich reagiert stärker auf Objekte, der andere stärker auf Substanzen“, berichtet Paulun. Dies deutet darauf hin, dass unser Gehirn für beide Kategorien verschiedene mentale "Algorithmen" einsetzt. Sobald das primäre Sehzentrum erste Hinweise auf eine der beiden Kategorien hat, leitet es die Signale auf den einen oder anderen Verarbeitungsweg. Dies könnte erklären, warum Säuglinge instinktiv den Unterschied zwischen Objekten und Substanzen verstehen, da ihr Gehirn bereits auf diese Zweiteilung hin ausgelegt ist.
Die Zerlegung von Objekten in Eigenschaften
Um einen Stuhl oder einen Hund als solchen zu erkennen, zerlegt das Gehirn ihn in einzelne Eigenschaften und setzt ihn anschließend wieder zusammen. Bislang war jedoch unklar, um welche Eigenschaften es sich dabei handelt. Wir leben in einer Welt voller Dinge, die wir identifizieren und in verschiedene Kategorien einordnen müssen. Nur so können wir miteinander kommunizieren und entsprechend sinnvoll handeln. Sehen wir etwas vor uns, das wir als Stuhl erkennen, können wir uns daraufsetzen. Um diese Kartierung durchzuführen und unserer Umgebung einen Sinn zu geben, müssen wir ständig die aktuell eintreffenden Informationen mit denen abgleichen, die wir bereits gelernt haben. Dazu zerlegt das Gehirn ein Objekt in seine einzelnen Eigenschaften, gleicht die mit bereits Bekanntem ab und setzt die Eigenschaften anschließend wieder zusammen. Je nachdem, wie ähnlich das Betrachtete zu einer bekannten Kategorie ist, wird es dann als Möbelstück oder Gefäß erkannt.
Wissenschaftler des Max-Planck-Instituts für Kognitions- und Neurowissenschaften (MPI CBS) in Leipzig haben nun in Zusammenarbeit mit dem National Institute of Mental Health in Bethesda, USA, ein Set aus 49 Eigenschaften ermittelt, nach denen wir beinahe alle Objekte bestimmen können, die also deren sogenannter mentaler Repräsentation zugrundeliegen. Darunter versteht man eine Art inneres Abbild, in das das Gehirn einen Reiz übersetzt. Das setzt sich demnach etwa aus der Farbe, Form und Größe zusammen, aber auch daraus, dass es „was mit Natur zu tun hat", „sich bewegen kann“, „wertvoll“ oder „was mit Feuer“ ist.
Lesen Sie auch: Gehirnvitamine: Ein detaillierter Überblick
„Unsere Ergebnisse zeigen, wie wenige Eigenschaften es eigentlich braucht, um alle Objekte in unserer Umgebung zu charakterisieren“, sagt Martin Hebart, Erstautor der dazugehörigen Publikation, die jetzt im renommierten Fachmagazin Nature Human Behaviour erschienen ist. Das Gehirn schlüsselt demnach die Umgebung in insgesamt 49 Merkmale auf, nach denen es alle Objekte kategorisiert. „Daraus lässt sich auch ableiten, was als besonders ähnlich und was als besonders typisch für eine Kategorie empfunden wird“, so der Neurowissenschaftler weiter. Ob also etwa die Muschel oder der Hund als typischeres Tier wahrgenommen wird.
Die Ergebnisse könnten aber auch medizinisch genutzt werden. Bislang glaubte man etwa, dass Patienten, die wegen einer Hirnschädigung bestimmte Tiere nicht identifizieren können, Lebewesen insgesamt nicht erkennen. Womöglich hat der Betroffene aber ein Defizit darin, die Eigenschaft „flauschig“ zu erkennen, die den Tieren zugrunde liegt.
Untersucht haben die Wissenschaftler diese Zusammenhänge mithilfe von fast 2.000 Bildern, die Objekte zeigten, die repräsentativ für alles aus unserer Umgebung sind. Den Studienteilnehmern zeigten sie dann jeweils drei der Bilder gleichzeitig, zum Beispiel Koala, Hund und Fisch, aber auch Koala, Türvorleger und Brezel. Daraus sollten die Teilnehmer jeweils eines auswählen, das sie als unterschiedlicher wahrnehmen als die anderen beiden. In letzterem Falle war das für die einen womöglich der Koala, weil er im Gegensatz zu den anderen beiden ein Lebewesen ist oder als „nicht flach“ betrachtet wird. Für andere mag das die Brezel gewesen sein, weil Türvorleger und Koala flauschig sind oder man nur die Brezel essen kann. Für wieder andere war es der Türvorleger sein, weil dieser aus anorganischem Material besteht.
Die Forscher testeten so mithilfe von knapp 5.500 Teilnehmern fast 1,5 Millionen Dreier-Kombinationen. Daraus entwickelten sie letztlich ein Computermodell, nach dem sie berechnen konnten, welches Objekt am wahrscheinlichsten in der jeweiligen Kombination aussortiert wird. Je häufiger zwei Objekte drin bleiben werden, desto ähnlicher sind sie sich. Dabei zeigte sich: Anhand ihres Modells konnten die Wissenschaftler sehr präzise die Ähnlichkeit zweier Objekte vorhersagen.
Visuelle Informationsverarbeitung im Gehirn: Ein Überblick
Die visuelle Informationsverarbeitung im Gehirn ist ein komplexer Prozess, der in mehreren Stufen abläuft. Zunächst werden die Informationen von der Retina über den Sehnerv (Nervus opticus) zum Thalamus, der wichtigsten Schaltstation zwischen Retina und Kortex, geleitet. Von dort aus gelangen die Informationen zum primären visuellen Kortex (V1) im Okzipitallappen.
Lesen Sie auch: Der Zusammenhang zwischen Medikamenten und Polyneuropathie
Der primäre visuelle Kortex (V1)
Der primäre visuelle Kortex ist der erste kortikale Bereich, der visuelle Informationen verarbeitet. Er ist retinotop organisiert, d.h. benachbarte Regionen der Netzhaut sind auch in V1 benachbart repräsentiert. Allerdings ist die Repräsentation nicht linear: Dem zentralen Gesichtsfeld (Fovea centralis), wo die Dichte der Photorezeptoren am größten ist, wird ein unverhältnismäßig großer Bereich in V1 zugewiesen.
In V1 werden elementare visuelle Merkmale wie Orientierung, räumliche Frequenz, Farbe und Bewegung analysiert. Dies geschieht durch spezialisierte Neuronen, die auf bestimmte Reizeigenschaften selektiv ansprechen.
Hubel und Wiesel (1959) entdeckten in V1 drei Neuronentypen:
- Einfache Zellen: Diese Zellen antworten auf Lichtstreifen einer bestimmten Orientierung, die in einer spezifischen Zone des rezeptiven Feldes dargeboten werden.
- Komplexe Zellen: Diese Zellen haben ebenfalls längliche rezeptive Felder mit Orientierungsachsen, aber die genaue Position des Reizes innerhalb des rezeptiven Feldes spielt keine Rolle.
- Hyperkomplexe Zellen: Diese Zellen antworten am stärksten auf bewegte Reize innerhalb des rezeptiven Feldes.
Die Neuronen in V1 sind in Säulen organisiert, die nach ihren bevorzugten Reizorientierungen geordnet sind. Benachbarte Säulen bevorzugen ähnliche Reizorientierungen, so dass sich die bevorzugte Reizorientierung in kontinuierlichen Schritten ändert. Zusätzlich zu den Orientierungssäulen wurden auch Augendominanzsäulen festgestellt, die den Input von demselben Punkt der Retina und nach der Augendominanz organisieren.
Weiterverarbeitung visueller Informationen
Von V1 aus werden die visuellen Informationen in verschiedene höhere kortikale Bereiche weitergeleitet, die für die Verarbeitung spezifischer visueller Merkmale zuständig sind. Man unterscheidet zwei Hauptverarbeitungsströme:
- Der ventrale Strom (Was-Pfad): Dieser Strom verläuft vom Okzipitallappen in den Temporallappen und ist für die Objekterkennung zuständig. Hier werden Informationen über Form, Farbe und Identität von Objekten verarbeitet.
- Der dorsale Strom (Wo-Pfad): Dieser Strom verläuft vom Okzipitallappen in den Parietallappen und ist für die Verarbeitung räumlicher Informationen und die Steuerung von Handlungen zuständig. Hier werden Informationen über Position, Bewegung und räumliche Beziehungen von Objekten verarbeitet.
In höheren visuellen Arealen werden immer komplexere Reizeigenschaften verarbeitet. So gibt es beispielsweise Areale, die selektiv auf Gesichter (Tsao) oder Hände ansprechen. Die Aktivität dieser Neuronenverbände ermöglicht es uns, Objekte zu erkennen und zu kategorisieren.
Die Rolle von Vorhersagen bei der Objekterkennung
Unser Gehirn erkennt Objekte in Millisekunden, selbst wenn es nur rudimentäre optische Informationen erhält. Forscher vermuten, dass dies gelingt, indem das Gehirn ständig Vorhersagen über Objekte im Gesichtsfeld trifft und diese mit den hereinkommenden Informationen abgleicht. Nur wenn dabei Fehler auftreten, müssen höhere Hirnregionen benachrichtigt werden, um aktiv ihre Vorhersagen anzupassen.
Wissenschaftler der Goethe-Universität haben diese Vermutung bestätigt. Sie identifizierten im Falle eines Vorhersagefehlers die Verstärkung von Hirnwellen, die an höhere Hirnareale gesendet werden. Diese Ergebnisse versprechen auch ein besseres Verständnis der psychischen Erkrankungen Schizophrenie und der Autismus-Spektrum-Störung.
Um Vorhersagefehler bei ihren Probanden zu provozieren, zeigten die Forscher ihnen sogenannte Mooney Gesichter, das sind Fotos von Gesichtern, die ganz auf schwarze und weiße Flächen reduziert sind. Diese erkennen wir meist mühelos. Wir können sogar Angaben über Geschlecht, Alter und Gesichtsausdruck machen - obwohl lediglich der Verlauf der schwarz-weißen Grenze ein wenig Information über das Gesicht enthält.
„In unserer Studie benutzten wir Mooney Gesichter, die gezielt zwei Erwartungen enttäuschten: erstens, dass wir Gesichter immer aufrecht sehen, und zweitens, dass Licht von oben einfällt. Dadurch hat sich die Gesichtserkennungs-Leistung deutlich verschlechtert und verlangsamt“, erklärt Prof.
Die "Predictive Coding"-Theorie besagt, dass Signale nur zur Verarbeitung in höhere Hirnregionen gesendet werden müssen, wenn Vorhersagen nicht erfüllt sind. Es müssten also verstärkte Signale in Richtung höherer Hirnregionen auftreten. Frankfurter Wissenschaftler vom Strüngmann-Institut entdeckten, dass Hirnwellen mit etwa 90 Schwingungen pro Sekunde bevorzugt auftreten, wenn höhere Areale des Gehirns adressiert werden.
„Wenn ein Vorhersagefehler provoziert wird, indem wir Bilder erzeugen, die lebenslang gelernten visuellen Alltagswahrheiten widersprechen, sollten wir die fehlerspezifischen Hirnwellen mit etwa 90 Schwingungen pro Sekunde vermehrt sehen. „Schließlich konnten wir auch zeigen, dass die ‚Fehlerhirnwellen‘ umso stärker sind, je langsamer das Erkennen ist. Die Ergebnisse sind bedeutsam, weil gerade diese Hirnwellen auch bei Patienten mit Schizophrenie und Autismus Spektrum Störung deutlich beeinträchtigt erscheinen. Das haben Messungen der vergangenen Jahre im Labor des Frankfurter Brain Imaging Centers gezeigt.
Unbewusste Blicksteuerung
Was führt zu der Entscheidung, wohin jemand schaut, wenn nichts Bestimmtes gesucht wird und zunächst unklar ist, wohin sich der Blick richten sollte? Der unbewusste Blick wird von einem automatischen Auswahlprozess gelenkt, für den ein neuronales Netzwerk im Gehirn verantwortlich ist. Eine Studie eines internationalen Teams unter Mitarbeit der Technischen Universität München (TUM) belegt dies nun.
Für diese Aufmerksamkeitssteuerung wird das Sehfeld ausgewertet und ausgewählt, wohin die Fovea als nächstes gerichtet wird. „Ein neuronales Netzwerk führt den Auswahlprozess durch, das sogenannte Isthmische System“, erklärt Luksch. „Wir konnten zeigen, dass einzelne Nervenzellen des visuellen Mittelhirns parallele Verbindungen zu drei Kerngebieten des Gehirns aufbauen, die jeweils eigene Rückkoppelungsschleifen mit dem visuellen Mittelhirn aufbauen“, fasst Luksch das Ergebnis zusammen. Dabei wurden bei der Rückkopplung einerseits die visuellen Reize verstärkt, andererseits unterdrückt. So wird unbewusst eine Auswahl getroffen.
„Überraschend für uns war, dass die verschiedenen Rückkoppelungsschleifen - verstärkende und hemmende - von ein und derselben Zelle angestoßen werden“, beschreibt Luksch. Die Studie ist nicht nur wichtig für die Grundlagenforschung: „Die gleichen Mechanismen, die dies beim Tier leisten, betreffen genauso den Menschen“, sagt Harald Luksch. Damit ließe sich besser verstehen, wie unsere Wahrnehmung und Aufmerksamkeit gesteuert werden, was wiederum in enger Verbindung zu unserem Bewusstsein steht - eines der spannendsten Gebiete der Neurowissenschaften. Weil sich die Aktivitäten der Nervenzellen beim nun erforschten Auswahlprozess wie ein technischer Schaltkreis darstellen lassen, könnten sich diese intelligent evolvierten Mechanismen im Tierreich auch für Roboter umsetzen lassen. Gerade für die Interaktivität mit Menschen, etwa bei der Pflege, sei es notwendig, dass Roboter ähnlich reagieren wie Organismen. Die zukünftige Bedeutung dieser Ergebnisse sieht Luksch daher in der bionischen Übertragung auf technische Systeme.
Gesichtserkennung: Ein Spezialfall der Objekterkennung
Die Bremer Hirnforscherin Doris Tsao forscht über die Vorgänge im Gehirn bei Gesichtserkennung. Dabei hat sie herausgefunden, dass nur ein ganz spezieller Teil des Gehirns für die Gesichtserkennung zuständig ist, der von dem Teil für das Erkennen anderer Objekte sehr streng unterschieden ist.
Doris Tsao: Wir wissen zwar noch nicht genau, wie unser Gehirn Gesichter unterscheidet, aber wir wissen bereits, dass das menschliche Gehirn mindestens drei unterschiedliche Regionen enthält, die auf die Gesichtsbearbeitung spezialisiert sind. Diese drei Regionen befinden sich im Temporallappen, im großen Bereich des Großhirns, der für die Objekterkennung verantwortlich ist.
Tsao: Ja, ich denke, Ihre Frage besteht aus zwei Teilen. Zum einen werden Gesichter nur von spezialisierten Hirnregionen bearbeitet. Die stärksten Indizien hierfür kommen von einem berühmten Patienten, C.K., der einen Hirnschlag in seinem Temporallappen erlitten hat. Danach konnte er immer noch Gesichter wiedererkennen, nicht jedoch andere Objekte. Und interessanterweise konnte er keine auf dem Kopf stehenden Gesichter erkennen, und dies deutet darauf hin, dass die Bereiche im Gehirn, die Gesichter verarbeiten, von den Bereichen, die andere Objekte bearbeiten, getrennt sind.
Tsao: Ich vermute, das hängt von dem jeweiligen Gesicht ab. Manche Gesichter, die wie Karikaturen aussehen, sind einfach wiederzuerkennen, selbst wenn man sie nur einmal gesehen hat, und andere Gesichter brauchen mehr Übung.
Tsao: Ja, genau. Erfahrung schärft unsere Gesichtsbearbeitung. Und interessanterweise kann Erfahrung jedoch auch unsere Wahrnehmungsfähigkeiten limitieren. Babys von weniger als sechs Monaten können verschiedene individuelle Gesichter von Menschen und sogar Rhesusaffen unterscheiden. Mit neun Monaten können sie die Affengesichter aber nicht mehr unterscheiden. Ein ähnlicher Spezialisierungsprozess findet auch in der Sprachentwicklung statt. Babys können die Laute aller menschlichen Sprachen unterscheiden, wir Erwachsene jedoch haben Probleme, chinesische Tonhöhen zu unterscheiden.
Tsao: Ich möchte verstehen, wie wir sehen, und obwohl das Affengehirn nur ein Zehntel der Größe des menschlichen Gehirns besitzt, sind die Sehsysteme beider erstaunlich ähnlich. Beispielsweise, wie bereits erwähnt, besitzen beide spezialisierte Gesichtsareale.
Tsao: Das Gehirn besteht aus Neuronen und Wahrnehmung entsteht aus den elektrischen Botschaften, die diese Neuronen einander senden, und nur mit Elektroden können wir diese Signale messen und die Botschaften entschlüsseln. Und ich untersuche die Aktivität der Zellen in den Gesichtsarealen.
Tsao: Ja, wir belohnen sie mit Saft. Das Gehirn ist sehr stark organisiert. Es ist sehr deutsch. Und die Bereiche, die Belohnung und Freude und so weiter verarbeiten, sind deutlich getrennt von den visuellen Arealen.
Tsao: Das liegt daran, dass die Gesichtsareale nur auf aufrechte Gesichter spezialisiert sind. Um auf dem Kopf stehende Gesichter zu erkennen, verwenden wir dieselbe Maschinerie, die sonst für die Erkennung von anderen Objekten wie Stühlen und Früchten sorgt. Die spezialisierten Gesichtsareale sind wirklich sehr spezialisiert. Sie zu bitten, auf dem Kopf stehende Gesichter zu erkennen, ist ein bisschen wie eine Violinistin zu bitten, auf einem Klavier zu spielen.
Tsao: Ich liebe den deutschen Namen Stiefmütterchen aus diesem Grund, die Blüte erinnert ein bisschen an ein Monstergesicht. Die Gesichtsareale sind immer wachsam und durchsuchen die einlaufenden visuellen Informationen ständig, um Gesichter zu finden. Und wir möchten ja nicht, dass uns etwas Wichtiges entgeht. Und eine Konsequenz davon ist, dass falscher Alarm ausgelöst werden kann.
Tsao: Ja, genau. Gesichter sind so wichtig für unser Sozialleben.
Tsao: Ja, tatsächlich gibt es Menschen, die alles außer Gesichtern erkennen können, und einer von diesen sagte: Ich konnte nicht verstehen, warum Räuber in Filmen immer ihr Gesicht maskieren. Das schien so dumm wie ihren Arm zu bedecken. Und Kernspinuntersuchungen deuten darauf hin, dass diese Menschen bilderhaft verbundene Gesichtsareale haben, und ich hoffe, dass unsere Forschung ihnen helfen wird. Wir untersuchen gerade, wie die Gesichtsareale miteinander verknüpft sind, und wenn wir erst einmal die Schritte verstanden haben, die zu einer normalen Vernetzung der Gesichtsareale notwendig sind, dann sollten wir in der Lage sein, zu verstehen, was bei Gesichtsblindheit abläuft.
Visuelles Gedächtnis und Aufmerksamkeit
Wir benutzen das visuelle Gedächtnis, um wahrgenommene Objekte zu kategorisieren. Ein Experiment von Mary Hayhoe et al. zeigte, dass Menschen beim Nachbauen von Flächen mit "Bausteinen" Augenbewegungen und das Kurzzeitgedächtnis nutzen. Die Informationen werden nicht über längere Zeit im Gehirn abgespeichert, sondern durch Augenbewegungen und das Kurzzeitgedächtnis überbrückt.
Unsere Aufmerksamkeit ist eine begrenzte Ressource. Sie wird auf die Bereiche gerichtet, die gerade wichtig erscheinen. Wenn die Aufmerksamkeit auf bestimmte Objekteigenschaften beschränkt ist, können andere Objekteigenschaften überhaupt nicht bemerkt werden ("attentional blindness").
Visuelle Vorstellungskraft
Wir können uns Objekte vorstellen und mit Hilfe eines "geistigen Auges" betrachten. Für bildliche Vorstellungen werden die gleichen visuellen Hirnareale genutzt wie für die normale visuelle Wahrnehmung. Die Funktionen sind anscheinend räumlich-kartographisch organisiert. Je weiter das gesuchte Objekt vom Ausgangspunkt der Suche entfernt ist, desto länger dauert es, es im mentalen Bild zu finden.