Optical Illusions and their use in HCI
Optische Täuschungen und ihr Einsatz in der Mensch-Maschine-Interaktion
Robert Meyer
Wenn der Begriff »optische Täuschung« fällt, denkt man vielleicht nur an belanglose Spielereien, die hauptsächlich dem Zeitvertreib dienen. Dieser Essay will jedoch zeigen, dass dem nicht so ist, sondern dass im Gegenteil die Forschungen, die sich mit diesem Phänomen beschäftigen, einen wichtigen Beitrag für die Gestaltung der Interaktion zwischen Mensch und Maschine liefern. Dazu wird zuerst allgemein definiert, was unter Human-Computer-Interaction (HCI), zu deutsch Mensch-Maschine-Interaktion, eigentlich zu verstehen ist. Anschließend wird eine Einführung in die Welt der optischen Täuschungen gegeben. Darauf folgend wird ausgeführt, wie optische Täuschungen im Computerbereich eingesetzt werden und welcher Nutzen daraus gezogen werden kann. Abschließend wird nach einem kurzen Fazit ein Ausblick auf die mögliche weitere Entwicklung in diesem Forschungsgebiet gegeben.
1. Human-Computer-Interaction (HCI)
Auch wenn das Arbeiten am Computer normalerweise nicht unter diesem Gesichtspunkt betrachtet wird, besteht diese Tätigkeit aus ständiger Interaktion zwischen dem Nutzer und seinem Arbeitsgerät: Der Mensch, der eine Aufgabe am Computer ausführt, interagiert mit seinem elektronischen »Gegenüber«, indem er Instruktionen mithilfe verschiedener Eingabemethoden Schritt für Schritt eingibt. Der Computer führt daraufhin die gewünschten Aktionen aus und gibt über ein meist visuelles Interface dem Nutzer Feedback über den neuen Systemstatus. Dieser interpretiert die am Bildschirm zur Verfügung gestellten Informationen und versucht daraus abzuleiten, welche Aktionen als nächstes ausgeführt werden müssen. Bei dieser »Kommunikation« zwischen Mensch und Maschine kann es, ebenso wie auch bei jeder rein zwischenmenschlichen Verständigung, zu Missverständnissen kommen [2]. Aus diesem Grund beschäftigen sich Forscher aus verschiedenen wissenschaftlichen Disziplinen mit HCI, um diese Interaktion so effizient wie möglich zu gestalten.
Doch was genau wird unter HCI verstanden? Die ACM SIGCHI-Gruppe schlägt, da es keine übereinstimmende Definition gibt, folgende Begriffsdeutung vor:
»Human-computerinteraction is a discipline concerned with the design, evaluation and implementation of interactive computing systems for human use and with the study of major phenomena surrounding them«. [10]
Ihrem Verständnis nach beschäftigt sich HCI also mit Design, Entwurf und Implementierung von interaktiven verarbeitenden Systemen für den menschlichen Nutzer und mit dem Erforschen von wichtigen Phänomenen, die diese Interaktionssituation betreffen. Dabei ist das Interesse nicht nur auf Computer beschränkt, sondern es lässt sich auch auf die Bedienung von Alltagsgegenständen, wie beispielsweise Kaffeemaschinen, übertragen. Aufgrund der vielfältigen Betrachtungsweisen ist HCI ein sehr interdisziplinäres Fach. Dabei legen die verschiedenen Forschungsrichtungen ihren Fokus auf unterschiedliche Aspekte: Die Informatik beschäftigt sich hauptsächlich mit dem Design von Anwendungen und dem Entwurf von Kommunikationsschnittstellen während das Interesse der Psychologie auf Theorien über kognitive Prozesse und einer empirischen Analyse von Nutzerverhalten liegt. Die Soziologie und die Anthropologie untersuchen die Zusammenhänge zwischen Technologie, Arbeit und Organisation, derweil die Industriedesigner interaktive Produkte entwerfen wollen [10].
2. Optical Illusions - Optische Täuschungen
Bevor auf den Einsatz von optischen Täuschungen in der HCI eingegangen wird, soll zunächst eingrenzt werden, was unter diesem Phänomen allgemein verstanden wird und welche Erklärungsansätze es dafür gibt.
In Meyers Lexikon Online werden optische Täuschungen beschrieben als...
»...den objektiven Gegebenheiten widersprechende Gesichtswahrnehmungen, v. a. bei geometrischen Konfigurationen (geometrisch-optische Täuschungen); beruhen physiologisch auf der Bau- und Funktionsweise des (menschlichen) Auges, psychologisch auf einer Fehldeutung beziehungsweise einem Schätzfehler bei Erfassung des Wahrgenommenen. Als weitere Ursachen können (besonders bei perspektivischen Täuschungen) Lernerfahrungen oder das Phänomen der Größenkonstanz (Größenschätzung eines Gegenstands unter unbewusster Berücksichtigung seiner Entfernung) sowie Einschätzungen von Farbhelligkeit und Farbverlauf eine Rolle spielen. Insbesondere die Gestaltpsychologie widmete sich der experimentellen Untersuchung von optischen Täuschungen und benutzte sie als Musterbeispiele für allgemeine Gesetze der Wahrnehmung.« [8]
Es kann also zwischen zwei grundsätzlichen Arten von optischen Täuschungen unterschieden werden: Einerseits diejenigen, die durch den physischen Aufbau des Auges bedingt sind und andererseits diejenigen, welche aufgrund einer Fehlinterpretation des Gehirns entstehen und somit psychischer Natur sind.
Bei ersteren wird beispielsweise der Umstand ausgenützt, dass das Auge maximal 60 Einzelbilder pro Sekunde verarbeiten kann, bei höheren Frequenzen können vom Sehapparat keine Zwischenstufen mehr erkannt werden. Die Tatsache, dass das Gehirn in der gleichen Zeitspanne nur maximal 30 Bilder auflösen kann, ist dagegen psychologischer Natur. [5, S. 180]
Ebenfalls durch psychologische Restriktionen bedingt sind optische Täuschungen, mit denen sich die von Meyer erwähnte und ab den zwanziger Jahren des vergangenen Jahrhunderts betriebene Forschungsrichtung der Gestaltpsychologie beschäftigt. Sie beschreibt in Gestaltgesetzen, wann Figuren als Ganzes beziehungsweise als zusammengehörig empfunden werden, wenn gewisse Rahmenbedingungen gegeben sind. Für die HCI sind dabei unter anderem die Gesetze der Nähe, der Gleichheit bzw. der Ähnlichkeit, des gemeinsamen Schicksals und der Vertrautheit bzw. Erfahrung wichtig. Zusammen mit den konkreten Beispielen in der HCI werden die Gesetze im dritten Abschnitt näher erläutert. [3, S. 193-196].
Vor dieser Konkretisierung soll jedoch noch eine genauere Differenzierung der auf psychologische Effekte zurückzuführenden optischen Täuschungen vorgenommen sowie ein möglicher Erklärungsansatz gegeben werden
Die erste Gattung psychologisch bedingter optischer Täuschungen sind statischer Art. Dabei wird der Betrachter über die tatsächlichen Eigenschaften der betreffenden Figur getäuscht. Hierunter fallen beispielsweise Kontrastillusionen, bei denen vermeintlich unterschiedliche Farbtöne in Wirklichkeit identisch sind und der Betrachter durch den Kontrast der betreffenden Farbe zum Hintergrund getäuscht wird. Ein weiters Beispiel für eine statische Illusion zeigt sich am so genannten Kanisza-Dreieck, bei dem der Betrachter unweigerlich ein Dreieck sieht, obwohl keine Kanten vorhanden sind und als Anhaltspunkte nur drei schwarze Kreise mit ausgesparten und zueinander gerichteten Dreiecken dienen. Dieser Effekt wird durch das Gesetz der Geschlossenheit erklärt. Darüber hinaus gibt es noch andere Illustrationen, die den Betrachter beispielsweise über die wahre Größe, Ausrichtung oder Parallelität der sich darauf befindlichen Objekte täuschen.
Neben den statischen gibt es auch dynamische optische Täuschungen. Hierunter fallen z.B. Bewegungsillusionen, die aus einem oder mehreren Einzelbildern bestehen können. Bekannt ist der in diesem Zusammenhang oft angeführte »Neckerwürfel«. Diese zweidimensionale Figur, die nur die Kanten eines Würfel als Drahtgitter darstellt, wird vom Gehirn als dreidimensionaler Würfel interpretiert. Die Wahrnehmung ist dabei bistabil, was bedeutet, dass das Gehirn zwei verschiedene geometrische Deutungen der Figur zulässt, zwischen denen es während des Betrachtens hin- und herschalten kann. [7,9,11]
Über diese Beispiele hinaus gibt es noch viele weitere interessante optische Täuschungen, deren Darstellung und Erklärung den Rahmen dieser Ausarbeitung deutlich sprengen würde.
Eine mögliche Erklärung für den Ablauf einer psychologisch bedingen optischen Täuschungen liefert die Neurokognitionsforschung und soll hier am Beispiel einer Bewegungsillusion dargestellt werden. Betrachtet man einen Gegenstand, so wird dieser auf die Netzhaut im Auge projiziert. Das sich dort befindliche neuronale Zellgeflecht wandelt die physikalischen Lichtreize in physiologische Signale um und leitet die kodierten Informationen in die Großhirnrinde weiter. Dort gibt es eine große Anzahl spezialisierter Areale für die Analyse und Verarbeitung spezifischer Einzelaspekte visueller Szenen, wie etwa Farbe, Bewegung oder Form. Diese Areale arbeiten keineswegs unabhängig voneinander, sondern vielmehr ist gerade die Interaktion zwischen den verschiedenen Hirnregionen entscheidend für einen geschlossenen Gesamteindruck des Gesehenen. Bei Versuchen wurde festgestellt, dass nicht nur tatsächlich wahrgenommene Sinnesreize für Aktivitäten in den spezialisierten Regionen sorgen, sondern dass beispielsweise der für Bewegungen zuständige Teil des Gehirns neben der Verarbeitung echter Bewegungen auch an der Wahrnehmung bestimmter Bewegungsillusionen beteiligt ist. Selbst wenn Versuchspersonen nur zwei abwechselnd aufblinkenden Quadrate sahen, wurde im angesprochenen Gehirnbereich eine erhöhte Aktivität gemessen und der Betrachter hatte den Eindruck, als existiere ein Objekt, dass sich zwischen zwei Punkten hin- und herbewegt. Die Großhirnrinde betätigt sich also als »kreativer Lückenfüller«, der aktive fehlende Sinnesdaten zu plausiblen Gesamteindrücken ergänzt. [7]
Es ist wichtig zu verstehen, dass optische Täuschungen nicht dadurch bedingt sind, dass unser Wahrnehmungssystem fehlerhaft arbeitet. Vielmehr werden bei deren Schaffung oft Mechanismen ausgenutzt, welche für die korrekte Interpretation der realen Welt notwendig sind. Dabei kommt zu tragen, dass das menschliche visuelle Wahrnehmungssystem auf eine dreidimensionale Umgebung ausgelegt ist. Wird nun eine zweidimensionale Abbildung betrachtet, muss entschieden werden, ob es sich dabei um eine Projektion eines dreidimensionalen Objekts oder ein rein zweidimensionales abstraktes Bild handelt. Deuten nun einige Teile der Darstellung darauf hin, dass es dem dreidimensionalen Raum zugehörig ist, wird versucht, es komplett in dieser Weise zu deuten. So beeinflusst die Umgebung einer Erscheinung ihre Interpretation immer stark mit. [11]
Nach dem Gesetz der Nähe werden Elemente, die räumlich benachbart sind, als zusammengehörig erlebt. Dies wird beispielsweise bei dem Design von Tastaturen genutzt, denn hier werden Tasten nach ihren Funktionen gruppiert. Auf einem Standardkeyboard liegen deshalb der Nummernblock, sowie die Pfeil- und Funktionstasten von den wie bei einer Schreibmaschine angeordneten Buchstaben-, Ziffern- und Formatierungstasten räumlich und funktional getrennt. Ein Äquivalent für dieses Vorgehen findet man auch in Software wieder: Apple fordert beispielsweise von Softwareentwicklern in seinen »Human interface guidelines« [1], sichere von unsicheren Buttons voneinander entfernt zu gruppieren. Das bedeutet, dass beim Schließen eines Dokuments die Schaltflächen für »Speichern« und »Abbruch« gruppiert und von »nicht speichern« räumlich abgesetzt sind.
3. Anwendung von optischen Täuschungen
Nach Klärung der für das Thema wichtigen Grundlagen stellt sich nun die Frage, wo optische Täuschungen in der HCI eingesetzt werden.
Wenn man nach dem Einsatz der physiologisch bedingten Fehldeutungen sucht, wird man schnell fündig: fast jede Darstellung auf visuellen Ausgabemedien - und somit eine der wichtigsten Schnittstellen zwischen Mensch und Maschine - beruht auf optischen Täuschungen: So nehmen wir beispielsweise die Darstellung auf einem Röhrenmonitor als vollständiges Bild wahr. Genau betrachtet handelt es sich allerdings um eine Täuschung, denn in Wahrheit regt ein von einer Glühkathode erzeugter Elektronenstrahl, der mit Hilfe von Magnetspulen die an der Frontscheibe aufgetragene Phosphorschicht zeilenweise abtastet, zu jedem Zeitpunkt immer nur einen Punkt auf dem Bildschirm zum Leuchten an. Da dies extrem schnell passiert und jeder Punkt je nach Bildwiederholungsfrequenz zwischen 48 und 170 Mal in der Sekunde auf- und auch etwas nachleuchtet, kann der Nutzer bestenfalls bei ungünstigen Einstellungen ein Flimmern erkennen. Bei Flüssigkristallbildschirmen hingegen wird zwar ein Bild vollständig angezeigt, jedoch ist hier - wie auch bei Röhrenmonitoren - jede Art von Bewegung eine Illusion, denn diese besteht nur aus einer Aneinanderreihung statischer Einzelbilder, die durch ihre schnelle Abfolge den Anschein einer stetigen Bewegung erzeugen. [5, S. 234ff]
Das Gesetz der Gleichheit und Ähnlichkeit besagt, dass ähnliche Elemente eher als zusammengehörig aufgefasst werden als unähnliche. Es sollten also gleichartige Informationen auch ein möglichst gleichartiges Erscheinungsbild haben. Dieses Prinzip findet vielfache Anwendung in der Gestaltung der graphischen Benutzeroberflächen von Software, welche nun anhand einiger Beispiele in MacOS X unterlegt werden. Wie in den meisten modernen Betriebssystemen werden gleichartige Datenarten (erkennbar an der Dateiendung) mit ähnlichen Icons repräsentiert und auch mit dem gleichen Programm geöffnet. Beispielsweise werden alle Graphikdateien standardmäßig durch eine Miniatur des Programm »Vorschau« dargestellt. Trotz dieser Vereinheitlichung kann aber aufgrund einer textuellen Einbettung der regulären Dateiendung in das Icon zwischen den unterschiedlichen Graphikformaten unterschieden werden. Desweiteren bietet dieses Betriebssystem die Möglichkeit, so genannte »Etiketten« zu benutzen. Mit deren Hilfe kann der Nutzer durch Zuordnung von Farben seine Daten farblich kodieren und somit auch eine optisch erkennbare Gruppierung inhaltlich ähnlicher Dateien vornehmen. Die Icons, mit deren Hilfe man die verschiedenen Applikation startet, wurden ebenfalls nach dem Gesetz der Ähnlichkeit gestaltet. Hier wird die Verwendung von farbenfrohen Symbolen für Nutzeranwendungen empfohlen, die Sinnbilder für Systemprogramme sollen dagegen seriöser gehalten werden.
Verursacht werden diese Effekte durch die im zweiten Teil aufgeführten Restriktionen des Auges.
Bei der Anwendung der schon erwähnten Gestaltgesetze zeigt sich die interdisziplinäre Ausrichtung der HCI: Aus den in der Psychologie erworbenen Erkenntnissen leitet die Informatik Hilfestellungen für die Gestaltung von Interfaces ab.
Das Gesetz des gemeinsamen Schicksals besagt, dass Dinge, die sich in die gleiche Richtung bewegen als zusammengehörig angesehen werden. In der Praxis findet man dieses Prinzip unter anderem bei der Verwendung von »Drag and Drop« wieder. Soll mit mehreren Dateien die selbe Operation durchgeführt werden, so kann der Nutzer diese markieren und somit deren Schicksal bündeln. Klickt er dann auf eine der Dateien und zieht sie über den Bildschirm, so werden sämtliche sich in dem markierten Block befindlichen Daten ebenfalls mitbewegt. Hiermit lässt sich intuitiv visuell erfassen, dass die Operationen für das gesamte Dateienbündel erfolgen
Nach dem Gesetz der Vertrautheit beziehungsweise der Erfahrung bilden Dinge eine Gruppe, wenn die Gruppe verraut erscheint oder etwas bedeutet. Eine Anwendung hierfür findet sich beispielsweise dort, wo mit sensiblen Daten umgegangen wird. So besteht vor allem auf Webseiten oft die Notwendigkeit entscheiden zu können, ob der Besucher nun menschlicher Natur ist oder ob es sich um einen so genannten »Bot« handelt. Dies sind Computerprogramme, welche Webseiten automatisiert nach Informationen durchsuchen. Vor allem wenn es sich bei den gesammelten Daten um Emailadressen handelt, welche später für SPAM-Versand missbraucht werden können, besteht ein erhebliches Interesse an einer Unterbindung derartiger Aktivitäten. Eine Möglichkeit dies zu unterbinden besteht in dem Einsatz von CAPTCHA (Completely Automated Public Turing test to tell Computers and Humans Apart). Dabei wird ausgenützt, dass das menschliche Wahrnehmungsvermögen aufgrund von Erfahrungen auch optisch oder inhaltlich entstellte Informationen in der ursprünglichen Art und Weise interpretieren kann. So kann ein Mensch eine Blume im Mittagslicht beispielsweise als dieselbe interpretieren, die am Abend dunkle Schatten bedecken. Computersystemen gelingen solche Interpretationen oft nicht ohne weiteres, auch wenn sie einem Menschen ganz »natürlich« erscheinen. In der Praxis werden momentan kleine Graphiken eingesetzt, auf denen mehre Zeichen in verzerrter Form dargestellt sind. Diese müssen vom Betrachter korrekt interpretiert werden und zur Autorisierung in ein Formularfeld eingegeben werden. [1, 3 S. 195f, 4, 12 S.50ff]. Es gibt noch viele weitere Beispiele für die Anwendung von optischen Täuschungen in der HCI, so dass dieses Auswahl nur als bei weitem unvollständige Auflistung gesehen werden kann.
4. Fazit und Ausblick
Als ich zu Beginn meiner Recherche zu diesem Thema einige Mitstudenten fragte, welchen Nutzen ihrer Meinung nach optische Täuschungen in der Human-Computer-Interaction hätten, konnte sich niemand so recht vorstellen, dass dieses Phänomen hier überhaupt irgend eine Rolle spielen würde. Dieses Ergebnis ist umso erstaunlicher da man - wie in dieser Abhandlung gezeigt - eigentlich ständig mit gewissen Formen der optischen Täuschung zu tun hat.
Welche Entwicklungen sind in diesem Themengebiet für die Zukunft zu erwarten? Auf der CHI 2006, eine der weltweit wichtigsten Veranstaltungen für HCI wurde ein Projekt vorgestellt, dass sich mit der Entwicklung einer Mustersprache auf Basis der Gestaltprinzipien beschäftigt. Diese verspricht eine einfache Unterstützung unter anderem beim Design von Nuterinterfaces, Icons oder Logos unter Beachtung der Gestaltgesetze. Es wäre wünschenswert, wenn dieses Streben erfolgreich wäre, denn der Einsatz dieser Kenntnisse könnte die Interaktion zwischen Mensch und Maschine weiter verbessern. [6]
Literaturangaben
[5] Peter A. Henning. Taschenbuch Multimedia. Carl Hanser Verlag, München, Wien, 2003.
[7] Lars Muckli, Axel Kohler. Interpret und kreativer Lückenfüller. Forschung Frankfurt, 10/2005 14-20.