Stile der Mensch-Computer-Interaktion und ihre Entwicklungstrends
2026-02-21 10:57:37··#1
Die Frage nach dem Verständnis der Beziehung zwischen Mensch und Computer hat eine lange Geschichte, die mit dem Wandel der grundlegenden Sichtweisen auf diese Beziehung einhergeht. In weniger als einem halben Jahrhundert seit der Einführung von Computern hat die Mensch-Computer-Interaktionstechnologie enorme Veränderungen erfahren. Dieser Artikel untersucht und fasst die Veränderungen und Entwicklungstrends dieser Technologie aus verschiedenen Perspektiven zusammen: (1) Hinsichtlich der konkreten Form der Benutzeroberfläche gab es verschiedene Entwicklungen, darunter Stapelverarbeitung, Online-Terminals (Befehlsschnittstellen), (Text-)Menüs sowie andere mehrkanalige Multimedia-Benutzeroberflächen und Virtual-Reality-Systeme. (2) Hinsichtlich der Art des Informationsträgers in der Benutzeroberfläche hat sich die Entwicklung von textbasierten Zeichenschnittstellen (CUI) über zweidimensionale grafische Benutzeroberflächen (GUI) bis hin zu Multimedia-Benutzeroberflächen vollzogen, wobei die Kommunikationsbandbreite zwischen Computern und Benutzern kontinuierlich verbessert wurde. (3) Bezüglich der Form der Computerausgabe hat die Entwicklung von der symbolbasierten Zeichenbefehlssprache über die auf visueller Wahrnehmung basierende grafische Benutzeroberfläche und die Multimedia-Benutzeroberfläche, die auch die auditive Wahrnehmung berücksichtigt, bis hin zum Virtual-Reality-System, das mehrere Sinne (einschließlich Tastsinn usw.) integriert, allesamt durchlaufen. In der symbolbasierten Phase begegneten die Benutzer lediglich einzelnen Textsymbolen. Obwohl die visuelle Interaktion unerlässlich war, waren visuelle Informationen nicht zwingend notwendig. Wesentlicher waren Symbole und Konzepte. In der visuellen Phase ermöglicht die Computergrafiktechnologie eine umfassende Nutzung visueller Informationen wie Farbe und Form in der Mensch-Computer-Interaktion. So kann das Potenzial der menschlichen Bildwahrnehmung und des bildhaften Denkens voll ausgeschöpft und die Effizienz der Informationsübertragung verbessert werden. Frühe Computersysteme gaben lediglich monotone Pieptöne von sich. Obwohl Multimediatechnologien gleichzeitig Audio- und Videoformate in die Mensch-Computer-Interaktion einführten, fehlten zunächst auditive Interaktionsmöglichkeiten. Die Nutzer befanden sich in einem passiven Hörzustand, und der Klang veränderte sich weder in Position noch in Richtung. Für die interaktive Eingabe wurden weiterhin Tastatur, Maus und andere Eingabegeräte grafischer Benutzeroberflächen verwendet. Heutzutage ist die Kombination visueller, auditiver und weiterer Kanäle in der Mensch-Computer-Interaktion unumgänglich. Insbesondere der auditive Kanal hat seine Bedeutung und Überlegenheit als ergänzender oder ersetzender Informationskanal unter Beweis gestellt [1]. (4) Hinsichtlich der Informationsdimensionen in der Mensch-Computer-Schnittstelle hat sich der Informationsraum von eindimensionaler Information (hauptsächlich Textfluss, wie bei frühen Telex-Terminals) über zweidimensionale Information (hauptsächlich zweidimensionale Grafiktechnologie mit Farbe, Form, Textur und anderen dimensionalen Informationen) und dreidimensionale Information (hauptsächlich dreidimensionale Grafiktechnologie, wobei die Anzeigetechnologie weiterhin hauptsächlich zweidimensionale Ebenen nutzt) bis hin zu mehrdimensionaler Information (mehrkanalige, mehrdimensionale Information) entwickelt. Aus jeder Perspektive spiegelt die Entwicklung der Mensch-Computer-Interaktion die zunehmende Bedeutung menschlicher Faktoren wider. Dadurch wird die Mensch-Computer-Interaktion natürlicher gestaltet, sodass Nutzer ihre alltäglichen Fähigkeiten ohne besonderen Aufwand oder Lernprozess einsetzen können. Dies reduziert die kognitive Belastung und steigert die Arbeitseffizienz. Dieser „nutzerzentrierte“ Ansatz prägt die Forschung im Bereich der Mensch-Computer-Interaktionstechnologie, insbesondere seit den 1980er Jahren. Dieser Artikel gibt einen kurzen Überblick über die Veränderungen in diesem Bereich und analysiert sie, bevor er einen Ausblick auf zukünftige Entwicklungen gibt. 1. Befehlssprachen-Benutzerschnittstelle: Die eigentliche Mensch-Computer-Interaktion begann mit dem Aufkommen von Online-Terminals. Seitdem können Computernutzer und Computer interaktive Dialoge in einer für beide Seiten verständlichen Sprache führen. Je nach ihren Eigenschaften lassen sich Sprachen in folgende Kategorien einteilen: a. Formale Sprachen: Diese künstlichen Sprachen zeichnen sich durch ihre Kürze, Strenge und Effizienz aus. Beispiele hierfür sind Fachsprachen aus Bereichen wie Mathematik, Chemie, Musik und Tanz. Computersprachen dienen nicht nur der Steuerung von Computern, sondern auch der Sprachverarbeitung. b. Natürliche Sprachen. Gekennzeichnet durch ihre Mehrdeutigkeit, Subtilität und ihren Reichtum. c. Quasi-natürliche Sprachen. Dies ist ein Sonderfall von Programmiersprachen. Die typische Form einer Befehlssprache ist ein Verb gefolgt von einem Substantivobjekt, d. h. „Verb + Objekt“, wobei beide Artikel Determinierer oder Quantoren enthalten können. Befehlssprachen können sehr einfache oder sehr komplexe Syntax aufweisen. Befehlssprachen erfordern ein enormes Maß an Auswendiglernen und umfangreiches Training und sind fehleranfällig, was Anfänger abschrecken kann. Sie sind jedoch relativ flexibel und effizient und eignen sich daher für Profis. 2. Grafische Benutzeroberfläche (GUI) Die grafische Benutzeroberfläche (GUI) ist heutzutage die gängigste Benutzeroberfläche und wird in verschiedenen Desktop-Computern und Grafikworkstations weit verbreitet eingesetzt. Zu den etablierten kommerziellen Systemen gehören Apples Macintosh, IBMs Presentation Manager (PM), Microsofts Windows sowie X-Window, OpenLook und OSF/Motif, die unter Unix-Umgebungen laufen. Das gemeinsame Merkmal aktueller grafischer Benutzeroberflächen (GUIs) ist ihre zentrale Ausrichtung auf Fensterverwaltungssysteme und die Verwendung von Tastatur und Maus als Eingabegeräte. Neben der Mehrfensterverwaltung ist die ereignisgesteuerte Technologie eine weitere weit verbreitete Kerntechnologie in Fensterverwaltungssystemen. GUIs und die Mensch-Computer-Interaktion basieren stark auf visueller und manueller Steuerung und weisen daher ausgeprägte direkte Bediencharakteristika auf. Obwohl Menüs nicht direkt mit GUIs verbunden sind, bieten sie im Vergleich zu zeichenbasierten Oberflächen eine reichhaltigere Darstellung mit verschiedenen Schriftarten, Symbolen und sogar 3D-Effekten innerhalb der Menüpunkte. Im Vergleich zu Kommandozeilenschnittstellen erfordern Menüs lediglich eine Bestätigung, ohne dass Systembefehle abgerufen werden müssen, wodurch die Speicherbelastung deutlich reduziert wird. Allerdings sind Menüs weniger flexibel und effizient, was sie unter Umständen für erfahrene Benutzer ungeeignet macht. Zu den Vorteilen von GUIs zählen eine gewisse kulturelle und sprachliche Unabhängigkeit sowie eine höhere Effizienz bei der visuellen Zielsuche. Die Hauptnachteile von GUIs sind ihr hoher Platzbedarf auf dem Bildschirm und die Schwierigkeit, nicht-räumliche, abstrakte Informationen darzustellen und deren Interaktion zu unterstützen. 3. Direkte Manipulations-Benutzeroberfläche Das Konzept einer direkten Manipulations-Benutzeroberfläche wurde erstmals von Shneiderman [2] vorgeschlagen. Direkte Manipulations-Benutzeroberflächen setzen stärker auf physische, räumliche oder bildhafte Darstellungen als auf einfache textuelle oder numerische Darstellungen. Erstere haben sich psychologisch als vorteilhaft für Problemlösung und Lernen erwiesen. Visuelle, bildhafte (künstlerische, intuitive, ganzheitliche) Benutzeroberflächen stellen eine Herausforderung für logische, direkte, textorientierte, rationale und auf impulsivem Denken basierende Benutzeroberflächen dar. Der Manipulationsmodus einer direkten Manipulations-Benutzeroberfläche ist das Gegenteil eines Befehlsschnittstellen-Modus und basiert auf einer Struktur aus „Objekt + Verb“, die die Entwickler von Windows 95 als „dokumentenzentriert“ bezeichneten [3]. Der Benutzer konzentriert sich letztendlich auf das Objekt, das er steuern und manipulieren möchte; er interessiert sich nur für die Semantik der Aufgabe und muss sich nicht durch Computersemantik und Syntax ablenken lassen. Bei einer Vielzahl physikalischer, geometrischer und bildhafter Aufgaben hat sich die direkte Manipulation als überlegen erwiesen; in abstrakten und komplexen Anwendungen stoßen Benutzeroberflächen mit direkter Manipulation jedoch an ihre Grenzen. Aus Sicht von UI-Designern gilt: a. Die Gestaltung von Grafiken ist relativ schwierig und erfordert umfangreiche Tests und Experimente; b. Die Darstellung komplexer und abstrakter Semantik ist relativ schwierig [7]; c. Es ist nicht einfach, Benutzeroberfläche und Anwendung unabhängig voneinander zu gestalten. Kurz gesagt, die direkte Manipulation der Benutzeroberfläche bietet nicht alle Vorteile von Befehlssprachenschnittstellen. 4. Multimedia-Benutzeroberfläche Die Multimediatechnologie gilt als Übergangstechnologie vor dem Durchbruch intelligenter Benutzeroberflächen und natürlicher Interaktionstechnologien. Vor dem Aufkommen von Multimedia-Benutzeroberflächen hatte die Benutzeroberfläche bereits den Übergang von Text zu Grafik vollzogen. Damals gab es in der Benutzeroberfläche nur zwei Medien: Text und Grafiken (Bilder), die beide statisch waren. Multimediatechnologie führte dynamische Medien wie Animationen, Audio und Video ein, insbesondere Audiomedien. Dies bereicherte die von Computern präsentierten Informationsformen erheblich, erweiterte die Bandbreite der Computerausgabe und verbesserte die Effizienz der Informationsaufnahme. Das enorme Potenzial von Multimediainformationen in der Mensch-Computer-Interaktion beruht hauptsächlich auf ihrer Fähigkeit, die Auswahl und Steuerung von Informationsdarstellungsformen zu verbessern. Gleichzeitig kann sie die Integration von Informationsdarstellungsformen mit der Logik und Kreativität der Nutzer fördern und deren Informationsverarbeitungskapazitäten hinsichtlich sequenzieller, symbolischer, paralleler und assoziativer Informationen erweitern. Multimediainformationen sind attraktiver als Informationen aus einem einzigen Medium und fördern die aktive Informationssuche anstelle der passiven Rezeption. Ein weiterer wichtiger Grund ist die durch Multimedia bedingte Informationsredundanz. Die Wiederverwendung anderer Medien oder die parallele Nutzung mehrerer Medien kann Mehrdeutigkeiten und Störungen in der Mensch-Computer-Kommunikation beseitigen. Multimedia-Benutzeroberflächen bereichern zwar die Formen der Informationsdarstellung, beschränken sich aber im Wesentlichen auf die Speicherung und Übertragung von Informationen und vernachlässigen das Verständnis der Bedeutung der Medieninformationen. Dies ist ihre Schwäche und begrenzt somit ihre Anwendung. Die Forschung zum Medienverständnis und zur Medienanalyse durch die Kombination von Multimedia- und KI-Technologien wird diese Situation verändern. Gleichzeitig wird die Forschung im Bereich mehrkanaliger Benutzerschnittstellen die Informationserkennungs- und -verarbeitungsfähigkeiten von Computern weiter verbessern, die Effizienz und Benutzerfreundlichkeit der Mensch-Computer-Interaktion steigern und die Technologie der Mensch-Computer-Interaktion sowie das Design von Benutzerschnittstellen auf ein höheres Niveau heben. 5. Mehrkanalige Benutzerschnittstellen: Multimedia-Benutzerschnittstellen erweitern die Möglichkeiten der Informationsdarstellung erheblich und ermöglichen es Nutzern, mehrere Sinneskanäle abwechselnd oder gleichzeitig zu nutzen. Die Mensch-Computer-Interaktion mit Multimedia-Benutzerschnittstellen zwingt Nutzer jedoch weiterhin zur Verwendung herkömmlicher Eingabegeräte (Tastatur, Maus und Touchscreen), wodurch die Eingabe einkanalig bleibt und ein deutliches Ungleichgewicht zwischen Eingabe und Ausgabe entsteht. Multimedia-Benutzerschnittstellen erweitern die Möglichkeiten der Informationsdarstellung, verbessern die Effizienz der Informationswahrnehmung und vergrößern die Kommunikationsbandbreite zwischen Computer und Nutzer. Bei grafischen Benutzerschnittstellen (WIMP/GUI) ist die Kommunikationsbandbreite zwischen Nutzern und Computern jedoch weiterhin weitgehend auf Tastatur und Maus beschränkt, was einen Engpass in der aktuellen Technologie der Mensch-Computer-Interaktion (HCI) darstellt. Seit den späten 1980er Jahren haben sich multimodale Benutzerschnittstellen (MUIs) als neues Forschungsfeld der Mensch-Computer-Interaktion (HCI) etabliert und international große Beachtung gefunden. Die MUI-Forschung zielt darauf ab, den Engpass der unausgewogenen Kommunikationsbandbreite in aktuellen WIMP/GUI- und Multimedia-Benutzerschnittstellen zu beseitigen, indem neue Interaktionskanäle, Geräte und Technologien wie Blickkontakt, Sprache und Gesten umfassend genutzt werden. Dies ermöglicht es Nutzern, über mehrere Kanäle einen natürlichen, parallelen und kollaborativen Mensch-Computer-Dialog zu führen. Durch die Integration präziser und ungenauer Eingaben aus verschiedenen Kanälen erfasst die Forschung die Interaktionsabsicht des Nutzers und verbessert so die Natürlichkeit und Effizienz der HCI. Internationale Forschung (einschließlich der oben genannten Projekte) konzentriert sich primär auf Eingabekanäle jenseits von Tastatur und Maus, insbesondere auf Sprache und natürliche Sprache, Gesten, Schreiben und Blickverfolgung, wobei der Fokus auf spezifischen Systemen liegt. MUIs und Multimedia-Benutzerschnittstellen tragen gemeinsam zur Verbesserung der Natürlichkeit und Effizienz der HCI bei. Multichannel-Benutzerschnittstellen konzentrieren sich primär auf die Informationseingabe des Nutzers in den Computer und das Verständnis der Nutzerabsicht durch den Computer innerhalb der Mensch-Computer-Schnittstelle. Ihre Ziele lassen sich wie folgt zusammenfassen: a. Natürliche Interaktion, die es Nutzern ermöglicht, ihre vorhandenen Alltagsfähigkeiten bestmöglich für die Interaktion mit dem Computer einzusetzen und so die kognitive Belastung zu reduzieren; b. Hocheffiziente Interaktion, die den Durchsatz und die Vielfalt des Informationsaustauschs in der Mensch-Computer-Kommunikation erhöht und die unterschiedlichen kognitiven Potenziale von Mensch und Maschine nutzt; c. Integration der Errungenschaften bestehender Mensch-Computer-Interaktionstechnologien, um die Kompatibilität mit traditionellen Benutzeroberflächen, insbesondere den weit verbreiteten WIMP/GUIs, zu gewährleisten und so das Wissen und die Fähigkeiten erfahrener und kompetenter Nutzer zu erhalten und deren Veralterung zu verhindern. Die Forscher stellen sich Mehrkanal-Benutzeroberflächen mit folgenden grundlegenden Merkmalen vor: a. Nutzung mehrerer sensorischer und effektorischer Kanäle. Obwohl sensorische Kanäle auf den Empfang von Multimedia-Informationen und effektorische Kanäle auf die Steuerung und Informationseingabe während der Interaktion fokussiert sind, sind beide untrennbar miteinander verbunden und arbeiten zusammen. Reicht ein einzelner Kanal (z. B. Sprache) nicht aus, um die Absicht des Nutzers vollständig auszudrücken, ist es notwendig, Informationen aus anderen Kanälen (z. B. Gesten) hinzuzufügen; mitunter werden zusätzliche Kanäle verwendet, um die Ausdrucksfähigkeit zu verbessern. Es ist besonders wichtig zu betonen, dass die abwechselnde und unabhängige Nutzung verschiedener Kanäle keine echte Mehrkanaltechnologie darstellt. Im Gegenteil, es ist notwendig, vollständig parallele und kollaborative Kanalbeziehungen zu ermöglichen. b. Dreidimensionale und direkte Manipulation. Die meisten menschlichen Aktivitäten sind durch Dreidimensionalität und direkte Manipulation gekennzeichnet (mathematische und logische Aktivitäten bilden hier möglicherweise eine Ausnahme). Menschen leben im dreidimensionalen Raum, sind daran gewöhnt, dreidimensionale Objekte zu sehen, zu hören und zu manipulieren, und möchten die Ergebnisse dieser Steuerung zeitnah sehen. Die Natürlichkeit der Mehrkanal-Mensch-Computer-Interaktion spiegelt diese wesentliche Eigenschaft wider. c. Zulassen ungenauer Interaktion. Menschen sind an ungenaue Informationskommunikation gewöhnt und nutzen sie im Alltag häufig. Die menschliche Sprache selbst ist hochgradig mehrdeutig. Das Zulassen mehrdeutiger Ausdrucksmittel kann unnötige kognitive Belastung vermeiden und trägt zur Verbesserung der Natürlichkeit und Effizienz interaktiver Aktivitäten bei; die Mehrkanal-Mensch-Computer-Interaktionstechnologie befürwortet Suffizienz statt Präzision [4]. d. Zwei-Wege-Interaktion. Menschliche Sinnes- und Wirkungskanäle weisen üblicherweise bidirektionale Eigenschaften auf, wie beispielsweise das Sehen und Blicken durch den Sehsinn und das Steuern und Berühren durch die Hände. Mehrkanalige Benutzerschnittstellen ermöglichen es Nutzern, umständliches, unnatürliches, häufiges und zeitaufwändiges Umschalten zwischen den Kanälen zu vermeiden und so Natürlichkeit und Effizienz zu steigern. So ermöglichen beispielsweise Blickverfolgungssysteme eine bidirektionale visuelle Interaktion, und auditive Kanäle können mithilfe von 3D-Audiolokalisatoren eine bidirektionale Interaktion erreichen, was bei einkanaligen Benutzerschnittstellen undenkbar ist. e. Implizite Interaktion. Manche vertreten die Ansicht, dass eine gute Benutzerschnittstelle es dem Nutzer ermöglichen sollte, sich voll und ganz auf die Erledigung der Aufgabe zu konzentrieren, ohne von der Schnittstelle abgelenkt zu werden; das heißt, eine gute Benutzerschnittstelle sollte für den Nutzer nicht existent sein. Mehrkanalige Benutzerschnittstellen, die eine natürliche Interaktion anstreben, erfordern nicht, dass Nutzer jede interaktive Komponente explizit definieren; stattdessen definieren sie diese implizit während der natürlichen Interaktion. Beispielsweise fällt der Blick des Nutzers auf natürliche Weise auf das Objekt von Interesse; oder die Hand des Nutzers greift auf natürliche Weise nach dem zu manipulierenden Ziel. 6. Virtual-Reality-Technologie. Virtual Reality (VR) ist auch als virtuelle Umgebung bekannt. Virtual-Reality-Systeme bieten Nutzern ein immersives und multisensorisches Erlebnis. Ihre drei Schlüsseleigenschaften, die sogenannten I3[5] – Immersion, Interaktion und Imagination – unterscheiden sie von bisherigen Mensch-Computer-Interaktionstechnologien und spiegeln die Entwicklung der Mensch-Computer-Beziehung wider: In traditionellen Mensch-Computer-Systemen sind Menschen Bediener, Maschinen reagieren passiv; in herkömmlichen Computersystemen sind Menschen Nutzer, und Mensch und Computer interagieren im Dialog; in der virtuellen Realität sind Menschen aktive Teilnehmer, und in komplexen Systemen können viele Teilnehmer in einer virtuellen Umgebung auf Basis eines Computernetzwerks kollaborativ zusammenarbeiten. Virtual-Reality-Systeme bieten ein breites Anwendungsspektrum und können nahezu jede menschliche Aktivität und jedes Anwendungsgebiet unterstützen. Als neue Form der Mensch-Computer-Interaktion besitzt die Virtual-Reality-Technologie ein größeres Potenzial als alle bisherigen Formen, eine harmonische, nutzerzentrierte Mensch-Computer-Schnittstelle zu realisieren. Viele Anwendungsergebnisse von Mehrkanal- und Multimedia-Technologien lassen sich direkt auf die Virtual-Reality-Technologie übertragen, die als integrationsbasierte Technologie ihre Mensch-Computer-Schnittstelle in eine multimediale Mehrkanal-Schnittstelle zerlegen kann. Hinsichtlich der physikalischen Eigenschaften konzentriert sich die Multimedia-Benutzeroberflächentechnologie auf die Lösung von Problemen der Natürlichkeit und Vielfalt bei der Darstellung und Ausgabe von Computerinformationen, während die Mehrkanaltechnologie die Probleme der Natürlichkeit und Vielfalt bei der Eingabe und Erkennung von Computerinformationen in den Fokus rückt. Andererseits weisen beide Mensch-Computer-Interaktionstechnologien interaktive, bidirektionale Eigenschaften auf. Beispielsweise ist die dreidimensionale virtuelle Klangdarstellung nicht nur eine statische Anzeige, sondern ermöglicht auch Interaktivität durch die Anpassung der Klangeffekte an die Kopf- und Körperbewegungen des Nutzers [6]. Ein weiteres Beispiel ist die bidirektionale Natur der visuellen Kanalinteraktion: Die Augen dienen sowohl der Aufnahme visueller Informationen als auch der Eingabe von Informationen durch Blickkontakt, wodurch die sogenannte visuelle Interaktion entsteht. 7. Was ist die ideale Mensch-Computer-Interaktionstechnologie? Die Mensch-Computer-Interaktionstechnologie hat im Laufe der Jahrzehnte mehrere bedeutende Entwicklungsstufen und typische Stile durchlaufen. Aktuell steht die dominante grafische Benutzeroberfläche (WIMP/GUI) unter ständiger Kritik, während neue Interaktionstechnologien noch nicht ausgereift und weit verbreitet sind. Infolgedessen wird mit großem Eifer darüber diskutiert, wie die zukünftige Mensch-Computer-Schnittstelle aussehen könnte, ohne dass ein Konsens besteht. Wir möchten uns dieser Diskussion anschließen und basierend auf unserer Forschung der letzten Jahre einige Ansichten zum idealen Interaktionsstil zwischen Mensch und Computer vorstellen. Unser Ausgangspunkt ist die Ergonomie, deren Grundprinzipien wir folgen und die Mensch-Maschine-Kollaboration unter dem Prämisse der „Menschenzentrierung“ betonen. Betrachten wir zunächst, wie Menschen vor dem Aufkommen der Ergonomie mit Werkzeugen umgingen. Unabhängig davon, wie der Entwickler eines bestimmten Werkzeugs die Beziehung zwischen Mensch und Werkzeug zu einem bestimmten Zeitpunkt verstand, hat der Mensch in der langen Geschichte menschlicher Arbeit (insbesondere der Herstellung und Verwendung von Werkzeugen) unermüdlich die Natur verändert und gezähmt, und die Herstellung und Verbesserung von Werkzeugen erfolgte stets unter dem Vorwand, diesem Zweck zu dienen. Ob und in welchem Umfang eine Schulung für die Verwendung eines bestimmten Werkzeugs erforderlich ist, ist ebenfalls Gegenstand von Diskussionen. Menschliche Fähigkeiten variieren in ihrer Einfachheit und Komplexität; Vielleicht kann jeder tippen lernen, aber nicht jeder kann ein Space Shuttle steuern. Eine plausiblere Sichtweise ist, dass „natürliche Mensch-Maschine-Interaktion auf alltäglichen menschlichen Fähigkeiten beruht“, was betont, dass keine spezielle Ausbildung erforderlich ist. Doch was genau sind „alltägliche Fähigkeiten“, und lassen sich alle alltäglichen Fähigkeiten ohne oder mit minimalem Training erwerben? Sprache (insbesondere Schriftsprache) erfordert Übung, ebenso wie Musik, Malerei und Fertigungsprozesse. Wir glauben, dass die Fähigkeiten, die Menschen beim Übergang von alltäglichen zu computergestützten Umgebungen besitzen, das ausmachen, was wir „alltägliche Fähigkeiten“ nennen. Dies ist ein relativer Begriff und geht nicht auf die Frage ein, ob Training notwendig ist. Daher können wir die Qualität von Mensch-Computer-Interaktionstechnologien nicht anhand der Notwendigkeit von Training beurteilen. Die Ergonomie lehnt Training nicht ab; der Wunsch, Training zu vermeiden oder zu reduzieren, ist menschlich, aber ob dies möglich ist, hängt nicht allein vom menschlichen Willen ab. Die Natürlichkeit der Mensch-Computer-Interaktion sollte durch Faktoren wie Zweck, Merkmale, Kontext und Implementierungskosten der jeweiligen Aufgabe bestimmt werden. Für frühe, „reine“ Computerprobleme und eine kleine Anzahl von Computerexperten mögen Befehlssprachen und Programmierschnittstellen ausreichend gewesen sein. Da Computer jedoch in nicht-numerischen Anwendungsbereichen wie CAD/CAM, Textverarbeitung und MIS weit verbreitet sind, ist eine umfangreiche Verarbeitung geometrischer, räumlicher, nicht-numerischer und nicht-symbolischer Informationen erforderlich. An diesem Punkt schränken die Komplexität und Abstraktion formaler Sprachschnittstellen sowie der Speicherbedarf die Tiefe und Verbreitung von Computeranwendungen ein. Infolgedessen haben sich Technologien zur direkten Manipulation von Benutzerschnittstellen etabliert und große Beliebtheit erlangt. Wir glauben, dass formale Sprachen nicht verschwinden werden, aber natürlich können wir nicht alle Benutzer zu ihrer Akzeptanz zwingen. Dies ist vergleichbar damit, dass die mathematische Sprache nicht durch andere Sprachformen (wie grafische oder gestische) ersetzt wird, obwohl Psychologen versucht haben, nicht-mathematische Methoden im Mathematikunterricht umfassend einzusetzen; ähnlich wie Popmusik und klassische Musik jeweils ihre eigenen Vorzüge haben und Hörer unterschiedliche Vorlieben haben. Derzeit haben direkte Manipulationsschnittstellen formale Sprachschnittstellen nicht nur nicht vollständig ersetzt, sondern weisen auch viele Einschränkungen auf. Inzwischen gewinnt die sprachbasierte dialogische Interaktion wieder an Bedeutung. Dialogische Sprache beschränkt sich dabei nicht mehr auf einfache formale Sprachen, sondern umfasst natürliche oder quasi-natürliche Dialoge, wie beispielsweise die sogenannte Sprache der vierten Generation, und sogar sprachbasierte Mensch-Computer-Dialoge. Benutzerschnittstellen, die auf formalen, natürlichen oder quasi-natürlichen Sprachen basieren, sind im Wesentlichen befehlsgesteuert und stellen das Gegenteil von Benutzerschnittstellen mit direkter Manipulation dar. Diese beiden grundlegend verschiedenen Mensch-Computer-Interaktionsmodelle finden sich in den alltäglichen Aktivitäten des Menschen wieder und entsprechen verbaler bzw. nonverbaler Kommunikation. Letztere umfasst im weitesten Sinne die Körpersprache, einschließlich Gesten, Mimik, Berührung, Nähe und Symbolen. Sprache wird erlernt und existiert sowohl in gesprochener als auch in geschriebener Form. Die Beherrschung der Schriftsprache erfordert eine formale und spezialisierte Ausbildung. Wir sind der Ansicht, dass die natürliche Mensch-Computer-Interaktion eine Form der Mensch-Computer-Interaktion ist, die hauptsächlich auf direkter Manipulation basiert und neben Befehlssprachen, insbesondere natürlichen Sprachen, existiert. Das Ideal der Mensch-Computer-Interaktion ist die „Freiheit des Nutzers“. Fazit: Die Mensch-Computer-Interaktion und Benutzeroberflächen haben die Phase der zeichenbasierten Befehlssprache hinter sich gelassen und befinden sich aktuell im Zeitalter der grafischen Benutzeroberflächen. Informatiker geben sich mit diesem Status quo jedoch nicht zufrieden und erforschen aktiv neue Formen der Mensch-Computer-Interaktion. Der aktuelle kommerzielle Erfolg von Spracherkennung und computergestützter Handschrifterkennung hat einen Vorgeschmack auf den Beginn einer natürlichen Mensch-Computer-Interaktion gegeben. Die rasante Entwicklung von Virtual Reality und Mehrkanal-Benutzeroberflächen zeigt, dass der zukünftige Entwicklungstrend der Mensch-Computer-Interaktion in Richtung eines sogenannten „Mensch-Computer-Harmonie“-Informationsraums [8] und eines auf natürlicher Interaktion basierenden Interaktionsstils [9] geht.