DIN EN ISO 9241-154
Ergonomie der Mensch-System-Interaktion - Teil 154: Sprachdialogsysteme (ISO 9241-154:2013); Deutsche Fassung EN ISO 9241-154:2013
Ergonomics of human-system interaction - Part 154: Interactive voice response (IVR) applications (ISO 9241-154:2013); German version EN ISO 9241-154:2013
Einführungsbeitrag
Interaktive Sprachdialogsysteme (IVR, en: interactive voice response) sind seit den späten 1980er Jahren ein verbreitetes Mittel im Kundenservice. Diese Systeme wurden gestaltet, um die Notwendigkeit von Telefonschleifen bei der Kundenbetreuung zu reduzieren oder zu beseitigen, indem viele der Funktionen automatisiert wurden, die üblicherweise von Menschen bei der Kundenbetreuung am Telefon bei der Bearbeitung von Kundentransaktionen geleistet wurden. Somit können Benutzer (das heißt Anrufer) Tätigkeiten wie das Abfragen von Zugfahrplänen, Buchbestellungen, Berichte über Probleme mit dem Kabelfernsehen durch Interaktion mit einem Sprachdialogsystem ausführen. Zusätzlich haben Sprachdialogsysteme häufig eine automatische Anrufweiterleitungsfunktion, damit der Anrufer mit der richtigen Stelle für seine spezifische Anfrage verbunden werden kann. DIN EN ISO 9241-154 beschäftigt sich weitgehend mit der Gestaltung des Dialogs zwischen Mensch und Sprachdialogsystem. Benutzer interagieren mit dem Sprachdialogsystem üblicherweise entweder über Spracheingabe oder über Tonwahl (DTMF) über das Telefontastenfeld. Wenn ein Sprachdialogsystem sprachgesteuert ist, verwendet es eine automatische Spracherkennungskomponente (ASR), die die Spracheingabe des Anrufers erkennt. Wenn es nicht sprachgesteuert ist, erkennt es üblicherweise nur Tonwahleingaben über das Telefontastenfeld oder manchmal Texttelefon-Eingaben (TTY). Sprachgesteuerte Sprachdialogsysteme sind eine relativ neue Entwicklung, und viele Systeme werden nun so gestaltet, dass sie beim Dialog mit einem Anrufer sowohl Tonwahl als auch Sprache erkennen. Das Sprachdialogsystem reagiert über Hardware und/oder Software, die dem Anrufer synthetische, digitalisierte oder aufgezeichnete Sprache vorspielt und zusätzlich nicht-sprachliche akustische Ausgaben ermöglicht. Die Tatsache, dass bei diesen Anwendungen keine visuelle Informationsanzeige vorhanden ist, stellt eine Herausforderung für die Dialoggestalter dar, weil das Navigieren durch die Anwendung sowie die Verarbeitung und das Erinnern der relevanten Informationen ohne Hilfe einer visuellen Anzeige eine Belastung für den Anrufer bedeutet. DIN EN ISO 9241-154 enthält Festlegungen zu Sprachdialogsystemen (IVR), die eine Kombination von Sprachtechnologien umfassen können, sich jedoch durch die Anwendung des Telefons als Informationsübertragungsmechanismus auszeichnen. Diese Festlegungen setzen keine visuellen Informationsanzeigen außer der Beschriftung auf den Tastenfeldern des Telefons voraus, mit der Ausnahme von Texttelefonen (TTY), die ein visuelles Anzeigenfeld für die Rückmeldung haben. Obwohl es für Gestalter von Benutzungsschnittstellen für Sprachdialogsysteme äußerst wichtig ist, die kulturellen und linguistischen Gesichtspunkte der Benutzungsschnittstelle zu berücksichtigen, die sich auf die vorgesehene Bevölkerungsgruppe auswirken, fallen diese Gesichtspunkte nicht mehr in den Anwendungsbereich dieser Norm. Ebenso wenig fallen detaillierte Festlegungen für die allgemeine Gestaltung von Benutzungsschnittstellen mit automatischer Spracherkennung (ASR, en: automatic speech recognition) in den Anwendungsbereich dieser Norm, da automatische Spracherkenner in verschiedenen Sprachen unterschiedlich funktionieren und die Technik sich weiter verbessert. Stattdessen befasst sich DIN EN ISO 9241-154 mit der Gestaltung der Benutzungsschnittstellen von Sprachdialogsystemen und nur mit den Bereichen der Gestaltung von ASR-Benutzungsschnittstellen, die sich auf die Dialoggestaltung auswirken. Viele gegenwärtige Sprachdialogsysteme stellen signifikante Zugangsschwierigkeiten für behinderte Menschen dar. Einige der Festlegungen in DIN EN ISO 9241-154 wurden insbesondere für Anrufer mit Behinderungen entwickelt, insbesondere gehörlose Menschen oder Menschen mit Hörschäden. DIN EN ISO 9241-154 gibt Leitsätze zur Gestaltung von IVR-Dialogen in sprachgesteuerten und auf Tonwahl beruhenden Sprachdialogsystemen. Deshalb liegt der Schwerpunkt dieser Norm auf der Schnittstelle zwischen Benutzer und IVR-Software sowie Datenbanken der Anwendung, die von Hardware und Software vermittelt wird, die Sprache und/oder Tonwahl erkennt und Sprachausgaben ermöglicht. Sowohl ASR-Systeme als auch DTMF-Erkennung bewirken Einschränkungen bei der Gestaltung von Sprachdialogen, und diese Einschränkungen wurden bei der Entwicklung der Leitsätze von DIN EN ISO 9241-154 berücksichtigt. Dennoch ist aus zwei Gründen nicht vorgesehen, dass DIN EN ISO 9241-154 sich der Gestaltung von ASR- oder DMTF-Benutzungsschnittstellen widmet. Erstens entwickelt sich die Technologie insbesondere für ASR-Systeme immer noch weiter und zweitens sind viele ASR-Benutzungsschnittstellen so gestaltet, dass sie eine visuelle Anzeige enthalten (zum Beispiel ASR-Diktatanwendungen), über die IVR-Anwendungen nicht verfügen. Zuletzt sind die meisten Leitsätze für sprachgesteuerte Dialoge zur Anwendung mit auf Grammatiken beruhenden Sprachdialogsystemen vorgesehen. Obwohl einige derselben Prinzipien für Systeme mit natürlichem Sprachverstehen gelten (NLU, en: natural language understanding, das heißt Anwendungen, die statistische Sprachmodelle verwenden), sind ausführliche Gestaltungsleitsätze für diese Anwendungen in dieser Norm nicht enthalten, da natürliche Spracherkennung mit einer anderen Technologie durchgeführt wird, und die Anwendung natürlicher Sprache in sprachgesteuerten Dialogsystemen sich noch in der Entwicklung befindet. Ebenso gibt es einige Gesichtspunkte der Anwendungsgestaltung, die für natürliche Sprachdialoge hinsichtlich der auf Grammatik beruhenden Sprachdialoge verschieden sind, zusätzlich zu den Unterschieden in der Dialoggestaltung, die sich besonders auf Spracherkennung beziehen. Es ist vorgesehen, dass die Festlegungen in diesem Dokument mit ISO/IEC 13714 "Information technology - Document processing and related communication - User interface to telephone-based services - Voice messaging applications" kompatibel sind, außer wenn anderweitig angegeben. Für diese Norm ist das Gremium NA 023-00-04-05 GAK "Gemeinschaftsarbeitskreis NAErg/NIA: Benutzungsschnittstellen" im DIN zuständig.
Dokument: zitiert andere Dokumente
Dokument: wird in anderen Dokumenten zitiert
Zuständiges nationales Arbeitsgremium
NA 023-00-04-05 GAK - Gemeinschaftsarbeitskreis NAErg/NIA: Benutzungsschnittstellen
Zuständiges europäisches Arbeitsgremium
CEN/TC 122/WG 5 - Ergonomie der Mensch-System-Interaktion
Zuständiges internationales Arbeitsgremium
ISO/TC 159/SC 4/WG 5 - Interaktionsgestaltung und Informationsdarstellung