Texteingabegeräte

Michael Sedlmair, München den 08.12.04

Abstract

Texteingabe stellt heutzutage in vielen Bereichen die wichtigste Schnittstelle zwischen dem Menschen und seinen digitalen Endgeräten dar. Man muss also entsprechend intuitive, sowie schnell bedienbare Eingabegeräte dafür zur Verfügung stellen. Dieser Aufsatz soll einen Überblick über derzeit verwendete Inputdevices für Text geben und kurz das Feld möglicher Alternativen beleuchten.

1. Einleitung

Die Eingabe von Texten in digitale Endgeräte wie PCs oder PDAs gehört zu einem der wichtigsten Aspekte in Bezug auf die Kommunikation zwischen Mensch und Maschine. Diverse Technologien zur Texteingabe haben sich bereits auf dem Markt durchgesetzt, so werden PCs zumeist über handelsübliche QWERTY Tastaturen oder PDAs über Graffiti-Handschrifterkennung bedient. Vorstellbar sind durchaus aber auch alternative Eingabegeräte für Text, wie beispielsweise das direkte Erkennen der gesprochenen Sprache oder alternativ designte Tastaturen, die in der Praxis zum Teil schon Eingang gefunden haben. In diesem Artikel soll eine Überblick über die heute existenten und wichtigen Texteingabegeräte gegeben werden, Augenmerk liegt dabei auf der Klassifizierung einiger verschiedener Ansätze, ein Anspruch auf Vollständigkeit besteht nicht.

2. Tastatur

2.1. QWERTY Tastatur

Das Prinzip der QWERTY Tastatur wurde bereits 1873 im Zuge der Einführung der mechanischen Schreibmaschine von dem Erfinder Christopher Latham Sholes entwickelt und ist bis heute im wesentlichen als Standard Eingabesystem für Texte erhalten geblieben. Zur Entwicklungsgrundlage dienten damals Forschungsauskünfte über die verschiedenen Wahrscheinlichkeiten aufeinanderfolgender Buchstabenkombinationen. Im deutschen wurde auf Grund der Anwendungshäufigkeit das Y mit dem Z vertauscht, warum hierzulande oftmals auch von der QWERTZ Tastatur gesprochen wird. Heute gilt sie trotz zahlreicher Alternativen als Standard-Tastatur und wird, ausgestattet mit etwaigen Zusatzfunktionen, prinzipiell zu jedem PC/Notebook ausgeliefert.

Ihre allgemeine Verbreitung greift dabei soweit, dass oft auch nicht tastenorientierte Eingabegeräte, wie beispielsweise der Touchscreen, auf das Konzept zurückgreifen. Die Abbildung der QWERTY Tastatur auf drucksensible Bildschirme oder ähnliche Ein-/Ausgabegeräte wird als Soft Keyboard bezeichnet.

Aufgrund der nahe zusammenliegenden Handstellung beim Tippen auf der QWERTY Tastatur, was bei häufiger und langer Benutzung zu Beschwerden führen kann, wurde 1996 von Microsoft eine modifiziert Version der QWERTY Tastatur eingeführt. Die Tasten der Split Tastatur wurden in der Mitte getrennt und schräg, seitlich angeordnet, so dass die Hände während des Tippens in einer natürlichen Position verweilen können. [1][2][Abbildung 1]

2.2. Dvorak-Tastatur

Über die Jahre hinweg wurden einige alternative Tastenbelegungen vorgestellt. So entwickelte August Dvorak 1936 seine Dvorak Tastatur, bei der alle Vokale nebeneinander in der Grundreihe positioniert wurden, so dass viele der gebräuchlichen Worte in der Grundstellung getippt werden konnten. Dadurch wurde erheblich an Weg, den die Finger zurücklegen mussten, gespart und eine höhere Tippgeschwindigkeit ermöglicht. Letztendlich konnte sie sich im Computerbereich jedoch nicht durchsetzen, da im ersten PC, dem "Alto" von Xerox, die alte QWERTY Tastatur verwendet wurde und diese seitdem die Vorherrschaft am Markt für sich behaupten konnte. [1][2][Abbildung 2]

2.3. Akkord Tastatur

Die oben beschriebenen Tastaturen funktionieren alle nach dem Prinzip, ein Tastendruck erzeugt genau ein Symbol. Eine andere Möglichkeit ist, dass jedem Finger genau eine Taste zugeordnet ist und durch kombiniertes Drücken der Tasten - ähnlich wie beim Spielen eines Akkordes auf dem Klavier - verschiedene Lettern geschrieben werden können. Erstmals wurde diese Architektur von Dougles Engelbert, dem Erfinder der Maus gefordert, der eine einhändig zu bedienende Tastatur anstrebte, um stets gleichzeitig mit der Maus interagieren zu können. Mit Hilfe einer Hand hat man die Möglichkeit 25 - 1 = 31 verschiedene Kombinationen zu greifen, was für das normale Alphabet ausreichen würde, für eine vollständige Tastatur jedoch zu dürftig wäre. Erweitert man dieses Prinzip auf zwei Hände, also auf zehn Finger erhält man entsprechend 1023 Möglichkeiten, das ist mehr als genug für eine gewöhnliche Texteingabe. Eine andere Möglichkeit die Funktionalität zu erweitern, ist, dem Daumen der eingebenden Hand mehrere Tasten zur Verfügung zu stellen und mit Hilfe von Shifttasten zwischen verschiedenen Modi zu wechseln. Prinzipiell können so genau die gleichen Resultate wie mit einer herkömmlichen Tastatur erzielt werden. Der große Vorteil gegenüber herkömmlichen Keyboards ist der minimale Bewegungsaufwand der Finger und der geringer Platzbedarf, so dass der Einsatz im Bereich von mobilen Endgeräten durchaus denkbar ist und teilweise auch schon fabriziert wird. [1][2][3][Abbildung 3]

3. Handschrifterkennung

3.1. Allgemeine Aspekte

Handschrifterkennung stellt eine attraktive Methode dar, Text in einen Computer einzugeben. Schreiben ist eine weitverbreitete Fähigkeit, die die Menschen nicht erst zusätzlich für eine bestimmte Anwendung, wie das Tippen auf einer Schreibmaschine, erlernen müssen. Ein generelles Problem stellt allerdings die korrekte Lesbarkeit von Lettern für den Computer dar, wie allgemein bekannt, sind nämlich individuelle Schriften von Menschen schon für ihre Mitmenschen oft nur schwer oder gar nicht rekonstruierbar.

Weite Verbreitung findet diese Technik durch den Einsatz von mobilen Handhelds, deren Anspruch es ist, möglichst platzsparend zu sein und der Einsatz einer Tastatur daher nicht zweckmäßig wäre. Technisch läuft Handschriftenerkennung meist so ab, dass man mit einem unbemienten Stift, dem Stylus, direkt auf einen drucksensitiven Bildschirm schreibt, der die Schriftzeichen erkennt und als Fließtext auf dem PDA wiedergibt.

Es werden dabei zwei konzeptuelle Ansätze unterschieden, das sequentielle Schreiben auf dem Bildschirm und das Schreiben von einzelnen Lettern in ein dafür vorgesehenes Feld. [1][4][5]

3.2. Unistrokes und Graffiti

Bei dem von Xerox entwickelten Unistrokes handelt es sich um ein Letternalphabet, das speziell auf digitale Erkennung hin optimiert wurde. Buchstaben bestehen aus fünf in einem Linienzug zeichenbaren Grundgeometrien (siehe Abbildung 4), die durch Variation der Rotation und der Schreibrichtung unterschieden werden. So entstehen 40 verschiedene Schriftzeichen. Nach einmaligem Erlernen kann mit Unistrokes bis zu 80 Prozent schneller geschrieben werden als mit normaler Handschrift.

Unistrokes wurde marktwirtschaftlich allerdings nie vorangetrieben, wo hingegen Palm dieses Konzept auffasste und mit ihrem Graffiti einen bombastischen Erfolg auf dem Markt der Handhelds feiern konnten. Das Graffiti-Alphabet ist im Gegensatz zu Unistrokes stark an die Buchstaben des römischen Alphabets angelehnt und ist daher zwar für den Computer etwas schwieriger zu erkennen, für den User dafür aber unheimlich leicht erlernbar.

Aufgrund des wirtschaftlichen Erfolges von Graffiti kam es schließlich zum Patentstreit zwischen Xerox und Palm. Dies führte auf Seiten von Palm zur Einführung des Standards Graffiti 2, in dem das bestrittene Konzept fallengelassen wurde, nach dem jeder Buchstabe mit nur einem Stiftansatz geschrieben werden kann. Palm konnte allerdings den Prozess in jüngsten Tagen für sich entscheiden, wodurch die Verwendung von Graffiti (1) legalisiert ist. Eine Aufarbeitung der juristischen Fakten würde an dieser Stelle jedoch den Rahmen der Arbeit sprengen. [1][4][5][6][7][Abbildung 4-6]

4. Spracherkennung

Eine extrem schnelle und benutzerfreundliche Methode zur Eingabe von Texten stellt die Spracherkennung dar. Die gesprochenen Worte werden einfach von einem Mikrofon abgenommen und vom Rechner in geschriebenen Text umgewandelt. Somit fungiert das Mikrofon als neues Eingabegerät.

Ganz so einfach funktioniert es natürlich nicht, größtes Problem stellt die menschliche Sprache an sich dar. Sie ist in ihrem Vokabular, Phonetik und Linguistik höchst komplex und umfangreich. Moderne Spracherkennungssysteme detektieren die menschliche Sprache anhand eines Akustik- und eines Sprachmodells und verfügen über große Datenbanken, in denen die entsprechenden Informationen abgelegt werden. Das akustische Modell basiert auf der Unterscheidung tausender, kleiner akustischer Sprachmuster, welche mit komplizierten mathematischen Algorithmen im Eingangssignal korrekt erkannt werden sollen. Die größte Schwierigkeit besteht darin, aus der kontinuierlich gesprochenen Sprache die diskreten Wörter herauszufiltern. Begriffe, die im fließenden Text verwendet werden, gleichen dem Frequenzbild des einzeln gesprochenen Begriffs nämlich nur geringfügig. Das Sprachmodell basiert auf einer Analyse der kontextabhängigen Zusammenhänge von Worten, so dass man beispielsweise auch gleichklingende Worte unterschiedlicher Bedeutung unterscheiden kann.

Der Einsatz von Spracherkennungssystemen verbreitet sich nur langsam, was hauptsächlich noch an der fehlenden Genauigkeit der Textübersetzungen liegt. [8][9][10]

5. Fazit und Ausblick

Die bewehrte QWERTY Tastatur wird wohl auch in näherer Zukunft noch Texteingabegerät Nummer eins bleiben. Allerdings bieten sich besonders im mobilen Bereich einige neue Alternativen an. So besteht bei den meisten Handhelds zwar noch die Möglichkeit über eine auf dem Screen abgebildete QWERTY Tastatur Text einzugeben, weit mehr verbreitet ist hingegen bereits schon die Eingabe mittels Handschrifterkennung. Auch die Technik, Spracheingabe zum Verfassen von Texten zu benutzen, befindet sich aufgrund fortschreitender Technik auf dem Vormarsch. Für mobile Geräte ist dies wegen des störenden Unweltlärms und der fehlenden Privathaltung von Daten zwar eher weniger interessant, es gibt dafür jedoch etliche andere Bereiche für die dies eine sehr gute Methode wäre um Texte schnell eingeben zu können.

Alternative Eingabesysteme für Text wird es in Zukunft sicherlich auch für spezifische Anwendungen geben. So wird bereits heute in Virtual Environment Anwendungen ein Handschuh-basiertes Texteingabesystem verwendet. Für eine normale Nutzung wäre dies eher ungeeignet, im speziellen Anwendungsgebiet hingegen ermöglicht es dem Benutzer ohne Umstände über die bereits vorhandenen Schnittstellen zu interagieren. [11]

 

Abbildungen

Abbildung 1: Das QWERTY Layout

Abbildung 2: Das Dvorak Layout

Abbildung 3: Akkord Tastatur

Abbildung 4: Unistrokes Alphabet

Abbildung 5: Graffiti Alphabet

Abbildung 6: Graffiti 2 Alphabet

 

Literatur/Links:

[1] http://www.obscure.org/rosenberg/chapter2.pdf

[2] http://www.hcilab.org/projects/historybook/

[3] http://www.klbschool.org.uk/ict/gcse/theory/5_1/5_1_input.htm

[4] http://www.deyerler.de/palm/palmerst.htm

[5] http://palm.vanbrayne.com/graffiti.html

[6] http://www.golem.de/0302/24121.html

[7] http://www.palmtopmagazin.de/news/alle/2523.php3

[8] http://www.spracherkennung.de/service/sebuch.htm

[9] http://de.wikipedia.org/wiki/Spracherkennung

[10] http://www.fask.uni-mainz.de/user/warth/Ki.html

[11] http://people.cs.vt.edu/~bowman/papers/pinch_keyboard.pdf