Presse
Wenn Sprachassistenten miteinander reden lernen
„Wann ist mein nächster Termin?“, „Bitte buche einen Konferenzraum für elf Uhr“, „Route zur nächsten Tankstelle“ – so vielfältig wie die Kommandos an Sprachassistenten, so unterschiedlich sind die jeweiligen Programme. Jeder Voice- oder Chatbot stammt von einem anderen Anbieter und die zugrundeliegende KI ist meist auf einen speziellen Anwendungsbereich trainiert: Essen zu bestellen, Veranstaltungen zu finden und zu buchen oder das Navigations- und Multimediasystem im Auto zu steuern. Wer mehrere Anliegen über einen einzigen Sprachassistenten erledigen will – etwa ein Buch kaufen, danach die aktuelle Musikauswahl ändern und sich schließlich einen Steuerberater empfehlen lassen möchte – stößt an technische Grenzen. Denn die einzelnen Programme können bislang kaum zusammenarbeiten. Ändern könnte das ein neuer Standard: Die DIN SPEC 2343 soll dazu beitragen, dass sich die Sprachassistenten, genauer gesagt die Künstlichen Intelligenzen hinter den Programmen, besser untereinander verständigen. Dadurch könnte ein Sprachassistent eine Anfrage, die er selbst nicht beantworten kann, an einen anderen Sprachassistenten weiterleiten, der darauf spezialisiert ist.
Verschiedene Lösungen einfacher kombinieren
Experten sprechen davon, die Interoperabilität der KIs für Natural Language Processing-Anwendungen zu verbessern. Natural Language Processing (NLP, Verarbeitung natürlicher Sprache) befasst sich damit, wie Computer Sprachbefehle verstehen und verarbeiten. Im Juni 2019 machte sich ein Konsortium aus zwölf Industrieunternehmen, Forschungseinrichtungen und Start-ups an die Erarbeitung des Standards. „Unser Ziel war es insbesondere, Programmierschnittstellen der NLP-KIs zu vereinheitlichen – das erleichtert es, unterschiedliche Technologien oder Lösungen verschiedener Anbieter zu kombinieren“, erklärt Tobias Martens, Gründer und Geschäftsführer von whoelse.ai, sein Unternehmen entwickelt Protokolle für KI-Interoperabilität. Tobias Martens und der freie IT-Berater Alexander Klug sind die Initiatoren der DIN SPEC 2343 „Übertragung von sprachbasierten Daten zwischen Künstlichen Intelligenzen – Festlegung von Parametern und Format“.
Von den einheitlichen Schnittstellen können unter anderem Unternehmen profitieren, die Produkte mit integrierten Sprachassistenten herstellen, etwa Fahrzeuge oder Smart Home-Lösungen sowie Betreiber KI-gestützter Hotlines. Wer Produkte international verkauft, muss zudem unterschiedliche NLP-KIs je nach Eingabesprache nutzen, beziehungsweise diese einfach austauschen können.
In der Praxis geprüft
Für die DIN SPEC 2343 hat das Konsortium unterschiedliche NLP-KI-Technologien verglichen und daraus erforderliche, optionale und empfohlene Parameter für die Programmierschnittstellen abgeleitet. Für die Verarbeitung einer Spracheingabe wäre es gemäß dem Standard beispielsweise erforderlich, dass der „Intent“ – der abstrahierte Grund des Nutzers für den Sprachbefehl an die NLP-KI – übermittelt wird. Der Intent ist meist ein Wort, etwa „Restaurant“. Optional wäre dagegen, den wortwörtlichen Befehl (Speech to Text) oder die Audioaufnahme zu übertragen. Wird dieser wörtliche Befehl nicht komplett übertragen, kann das ein Vorteil in Sachen Datenschutz sein.
Das Konsortium der DIN SPEC 2343 hat seine Ergebnisse außerdem in der Praxis überprüft: In mehr als 35 Workshops und Interviews mit industriellen Anwendern von NLP-KIs wurden diese diskutiert. Insbesondere Automobilhersteller und Telekommunikationsanbieter zeigten großes Interesse an einem Standard für NLP-KI-Interoperabilität. Die DIN SPEC 2343 ist kostenlos erhältlich unter https://www.beuth.de/de/technische-regel/din-spec-2343/326795941.