21. Podcast-Folge: Sprachsteuerungen im Computer: Was steckt dahinter und wer braucht's?
Podcast - Digitale Barrierefreiheit
Ein Austausch mit Barrierefreiheitstester Thomas Ernst über seine Erfahrung mit Sprachbedienungen
Sprachprogramme oder Sprachsteuerungen haben sich in den letzten Jahren enorm entwickelt. War Spracherkennung noch vor zehn Jahren etwas, das sich in der Nische der Hilfsmittel befunden hat, sind die Entwicklungen in den letzten Jahren von großen Konzernen wie Amazon, Google oder Apple vorangetrieben worden.
Smarte Assistenten wie Siri oder Alexa in Verbindung mit einem Smarthome oder Spracheingabe am Handy werden inzwischen von Millionen Menschen benutzt und mittels künstlicher Intelligenz weiter trainiert und entwickelt. Es gibt aber auch Spezialprogramme, von denen speziellen Mensch mit Einschränkungen profitieren.
In dieser Folge tausche ich mich mit Barrierefreiheitstester Thomas Ernst über unsere persönlichen Erfahrungen mit Sprachbedienungen aus.
-
- Thomas Ernst hat auch für das Team Usability seine Erfahrungen mit Spracherkennung geteilt. Mehr dazu im Artikel Konformitätstest unter Spracherkennung
-
Moderator: Dennis Bruder
Gast: Thomas Ernst
Sprecherin: Alexandra Goedeke
Alexandra Goedeke (Einspieler mit Musikuntermalung): Barriere los! Der Podcast für barrierefreie Lösungen im digitalen Raum.
Dennis Bruder: Hallo und willkommen zu Barrierelos, dem Podcast zur digitalen Barrierefreiheit. Mein Name ist Dennis, Bruder von der Beratungsstelle digitale Barrierefreiheit in Bayern, und heute haben wir jemanden eingeladen, der sich mit digitaler Barrierefreiheit schon seit vielen Jahren beschäftigt und sich auch besonders mit dem heutigen Thema aus eigener Erfahrung gut auskennt, nämlich Sprachsteuerungen. Unser heutiger Gast heißt Thomas Ernst. Er arbeitet bei uns in der Pfennigparade als zertifizierter BITV-Tester und hat selbst eine körperliche Einschränkung. Bevor ich jetzt aber noch mehr erzähle, möchte ich Thomas, dich erst mal bitten, ein bisschen was über dich zu erzählen.
Thomas Ernst: Ja, also ja, also ich heiße Thomas. Ich bin 53 Jahre alt. Ich habe wie gesagt, in körperliche Einschränkung. Genauer gesagt ist das Spinal Muskelatrophie, auf Deutsch Muskelschwund. Ich kann also Arme und Beine nicht bewegen, ganz geringfügig noch einen Finger, der mir aber beim Computerbedienen soweit nichts hilft. Ich bediene meinen Computer einmal über die Sprachsteuerung, dann aber auch über eine spezielle Tatstatur, und wie der Dennis schon gesagt hat, arbeite ich hier in der Stiftung Pfennigparade, seit ungefähr 15 Jahren beschäftige ich mich mit digitaler Barrierefreiheit und wohne auch hier im Haus.
Dennis Bruder: Du hast gesagt, du nutzt ja aufgrund deiner Behinderung Sprachsteuerungen und benutzt auch eine Tastatur. Für was nutzt du jetzt eine Sprachsteuerung und für was nutzt du die Tastatur?
Thomas Ernst: Ja, also, die Sprachsteuerung hat viele Vorzüge, aber auch ihre Grenzen. Also , natürlich um Text zu diktieren. So war ja mal ursprüngliche Sinn von den Spracheingaben. Man kann mittlerweile aber auch viel mehr machen mit der Sprachsteuerung. Ich könnte meinen ganzen Computer mit der Sprachsteuerung bedienen. Meine Tastatur ist doch in manchen Fällen besser, zum Beispiel in der Arbeit, wenn ich mal ieinen Schnipsel in HTML eintippen mussin dem Prüfbericht oder englische Begriffe, da tut sich natürlich dann Dragon schwer, weil es überwiegend natürlich Deutsche Ausdrücke kennt. Da wechsel ich dann auf die Tastatur, es ging auch mit Spracheingabe, aber es dauert einfach länger. Also, ich könnte auch mit Spracheingabe jedes Zeichen einzeln eingeben, aber da bin ich mit Tastatur einfach schneller.
Dennis Bruder: Ja, das ist ein guter Punkt mit den Grenzen. Also, ich erzähle jetzt auch nochmal kurz was zu mir, weil ich selbst auch Sprachsteuerungen täglich nutze. Ich habe eine hohe Querschnittlähmung, kann insofern meine Arme auch nicht bewegen und nutze Sprachsteuerungen eigentlich auch in Kombination mit einer Spezial-Maus, weil gewisse Sachen schneller gehen, wenn ich sie in Kombination benutze. Aber, Thomas, ich glaube, du nutzt dann doch Sprachsteuerung deutlich weiter als ich. Du nutzt, wie du gesagt hast, in Ergänzung die Tastatur, aber benutzt es teilweise auch komplett über eine Sprachsteuerung. Kannst du da mal so erklären, was man mit dieser Sprachsteuerung so maximal alles machen kann?
Thomas Ernst: Ja, also, wie du sagst, privat nutz ich beispielsweise ausschließlich die Sprachsteuerung. Da habe ich da keine Tastatur und muss somit also zwangsweise den Computer komplett mit Sprache bedienen. Ja, was kann man alles mit der Sprachsteuerung machen? Man kann zum Beispiel sogar die Maus steuern. Das benutze ich häufig natürlich in erster Linie um im Internet zu surfen . Da gibt es beispielsweise so ein Mausraster. Da kann ich mit dem Befehl ein Mausraster mit neun Feldern über den Bildschirm legen.
Dennis Bruder: Das ist so eine Art Gitter, so kann man sich das vorstellen.
Thomas Ernst: Genau. Und diese Felder sind durchnummeriert und so kann ich immer die Zahl von einem Feld sagen und dann wird das Feld wieder in neun Felder untertunterteilt und die Maus wird immer in der Mitte mitgeführt, und so kann ich an jede beliebige Bildschirmstelle hinklicken mit Rechtsklick, Linksklick, Doppelklick und so, das ist eine feine Sache. Dann kann, wie ich vorhin schon kurz erwähnt habe auch die Tastatur steuern. Ich kann also im Prinzip jede Taste, die vauf der Tastatur vorhanden ist, auch mit Sprache auslösen, brauche ich dann auch im Einzelfall. Schneller für Text ist natürlich ganz selbstverständlich das normale freie Diktieren von ganzen Sätzen. Was dann auch noch möglich ist mit der Spracheingabe, ich nutze das persönlich nicht so häufig, weil es erst seit ein paar Jahren relativ gut funktioniert. Ich selbst nehme schon Sprachsteuerungen seit 20 Jahren, und damals war das noch nicht so gut. Man kann einzelne interaktive Elemente in der Anwendung oder auf der Webseite direkt ansprechen. Also wenn man beispielsweise ein OK-Button hat, dann kann ich sagen: Klick OK, und dann führt die Sprachsteuerung den Klick auf den OK-Button, ohne dass ich die Maus dahin positionieren muss.
Dennis Bruder: Da kommen wir eigentlich vielleicht gleich zu einem Punkt, der aus deiner beruflichen Sicht dann auch ganz interessant ist, weil du ja auch viel mit der digitalen Barrierefreiheit und mit der Technik, die dahintersteckt, zu tun hast. Dieser, dieser Klick auf OK auf einer Webseite oder in dem Programm oder sonst irgendwo, der braucht eine gewisse Voraussetzung seitens der Programmierung, also seitens der Technik. Kannst du dafür vielleicht ein, zwei Sätze sagen? Was man so aus Programmiersicht dann tun muss, um das zur Verfügung zu stellen, dass eine Sprachsteuerung drauf zugreifen kann.
Thomas Ernst: Genau es geht jetzt ein wenig ins Detail. Also ist vielleicht was für Entwickler. Jedes Element, das man bedienen kann, auf ner Seite oder in einem Programm, braucht einen programmatisch ermittelbaren Namen. Wir nennen das in der Barrierefreiheit den "zugänglichen Namen" oder den "Accessible Name". Den sieht der Benutzer gar nicht, des ist wirklich auf der Programmierebene dahinter und wenn man da was verkehrt macht, dann ist der dieser progammierte Name anders als der Name, der angezeigt wird. Wenn ich jetzt also den Button mit OK am Bildschirm anzeige, aber programmiertechnisch den Button "Absenden" nennen würde, dann müsste ich, um den auszulösen, mit der Sprachangabe "Klick Absenden" sagen. Aber das weiß ich natürlich nicht, weil ich nur OK sehe. Und diese Anforderung hat man jetzt auch erkannt und ist jetzt auch in der neuesten Version von der WCAG, das ist ein internationaler Standard für barribarrierefreie digitale Angebote, wurde es jetzt ein Kriterium aufgenommen, das abruft, dass der sichtbare Name mit, also zumindest teilweise, mit dem programmatisch ermittelbaren Namen übereinstimmt.
Dennis Bruder: Okay, kleiner Exkurs in die digitale Barrierefreiheit, aber gehen wir jetzt nochmal ein Schritt zurück, und zwar: für wen sind denn Sprachsteuerungen so geeignet, deiner Meinung nach, und für wen vielleicht auch nicht? Also wer hat vielleicht auch Probleme mit einer Sprachsteuerung?
Thomas Ernst: Ja, also ganz klar für Menschen mit körperlichen Einschränkungen, so wie du und ich, da ist es wirklich eine sehr große Hilfe. Wenn man das Feld aber a weng aufmacht, dann ist das natürlich auch eine Hilfe, wenn man vorübergehend seine Hände nicht benutzen kann und was ja immer mehr kommen wird sind digitale Angebote, die man im Auto nutzen kann, und da ist natürlich eine Sprachsteuerung nützlich, dass man die Hände am Lenker lassen kann. Für wen es dann nicht so gut geeignet ist, sind natürlich Personen, die eine undeutliche Aussprache haben. Also meine Aussprache ist ja auch nicht so gut, es funktioniert aber, aber beispielsweise Menschen mit Cerebralpares, also umgangssprachlich Spastiker, die haben natürlich dann schon Probleme... Das wäre eigentlich sehr gut, weil sie sich schlecht bewegen können, aber durch die undeutliche Aussprache haben die dann natürlich schon Probleme in der Bedingung.
Dennis Bruder: Ja, da muss man dann sicherlich andere Alternativen noch finden. Stichwort, für den es so noch alles geeignet sein könnte: Sprachsteuerungen. Da sind wir inzwischen sehr weit gekommen, eigentlich, weil diese Sprachassistenten gibt es ja inzwischen eigentlich überall. Also wer sich zuhause mal in Smarthome angeschafft hat, profitiert ja auch in irgendeiner Weise davon. Also, es betrifft natürlich auch nicht nur Menschen mit Einschränkungen, und da kommen wir dann auch zu dem Punkt, der sich ja in den letzten Jahren auch sehr stark entwickelt hat, und zwar das ja nicht nur jetzt so Spezialprogramme, sich mit Sprachsteuerung beschäftigen. Ich glaube, du nutzt das Dragon Naturally Speaking hieß das mal, jetzt heißt es, glaube ich nur noch Dragon...
Thomas Ernst: Ja, ich denke schon Dragon Naturally Speaking.
Dennis Bruder: Ja, genau, und es gibt aber inzwischen auch integriert in den Betriebssystemen, teilweise aber auch in Programm war so Spracheingabe. Jetzt gibt's haben wir beide so ein bisschen Erfahrungen damit, beziehungsweise du hast mal die Windows Lösung getestet, die du ja sonst eigentlich nicht benutzt, weil du eben dieses Dragon Spezialprogramm nutzt. Was glaubst du denn, was damit so möglich ist?
Thomas Ernst: Ja, ich habe kurz mal reingeschaut, Windows bietet zwei Varianten an, des verwirrt am Anfang erstmal: einfach eine Spracheingabe, wo man wirklich nur Text eingeben kann und dann aber auch eine Sprachsteuerung, die gibt schon seit Windows Vista. Damals habe ich es mal ein bisschen benutzt, aber seitdem eben nur noch Dragon. Und diese große Sprachsteuerung, könnte man es nennen, von Windows ist so auf den ersten Blick, wie ich es mir angeschaut habe, genauso mächtig wie Dragon. Sie ist nicht ganz so komfortabel, finde ich, aber hat vielleicht auch technisch manchmal ne bessere Umsetzung. So Probleme, die Dragon hat, die hat diese Windows-Sprachsteuerung nicht.
Dennis Bruder: Ja, ja, das ist auch so meine Erfahrung. Also, ich nutze am Mac die integrierte Sprachsteuerung ausschließlich inzwischen... früher gab's auch mal Dragon für den Mac, aber das gibt es jetzt tatsächlich nicht mehr. Das haben sie in dem Moment eingestampft die Entwicklung, wo Apple angekündigt hat, dass sie eigene Sprachsteuerung machen wollen und meiner Erfahrung nach ist es auch so, manche Sachen sind einfach besser mit dieser integrierten Lösung, und manche sind mit Dragon besser. Trotzdem, also, meine Erfahrung ist, dass sicherlich nicht alles ideal ist und dass ich auch froh bin um die kombinierte Lösung mit meiner Maus. Aber ich habe jetzt auch gehört, dass im nächsten Update nochmal eine ganze Menge Sachen auch in der Verbesserung der Sprachsteuerung kommen sollen. Also, da lohnt sich vielleicht auch mal dran zu bleiben. Und wenn man jetzt gar keine Erfahrung mit Sprachsteuerungen hat, dann ist es sicher auch eine gute Lösung, sich einfach mal mit den integrierten Lösungen zumindest zu beschäftigen, damit man einfach mal ein Gefühl dafür bekommt, was so eine Sprachsteuerung. Kannst du das mal kurz erklären, was der Unterschied ist zwischen wirklichen Sprachsteuerung und so smart Assistenten oder Spracheingaben?
Thomas Ernst: Ja gut, eigentlich haben wir dann jetzt schon dabei, was du erwähnt hast: die Sprachsteuerung, wie wir es jetzt gerade erklärt haben, dann die Eingaben, wobei die Begriffe häufig identisch verwenden werden, also auch bei Microsoft oft in Support-Seiten, wird da nicht genau getrennt. Also nennen wir es mal Spracheingaben, mit der man einfach Text in ein Text-Eingabefeld diktieren kann.
Dennis Bruder: Kenne ich auch vom Handy teilweise. Da gibt es ja auch so ein kleines Mikrofon, das man drücken kann, und dann kann man auch einfach nur Text diktieren.
Thomas Ernst: Genau, und dann gibt's die Sprachassistenten, mit denen man Funktionen auslösen kann, also einerseits am Handy: rufe XY an oder wie du angesprochen hast, die ganzen Smart home Sachen. Das kann man ja dann eher als Sprachassistent sehen.
Dennis Bruder: Genau also, da gibt es ganz unterschiedliche Funktionen. Aber diese Sprachprogramme, die ja wirklich für Menschen mit Einschränkungen vielleicht mal auch gedacht und entwickelt waren, die sind deutlich mächtiger, und die können eine ganze Menge an Funktionalität machen. Man kann auch Sachen korrigieren, man kann sogar Sprachbefehle individualisieren und also Spezialbefehle eingeben, die das Programm dann lernt. Also da ist man relativ flexibel, auch nochmal so perspektivisch: Also, meiner Meinung nach wird sich das ganze Thema auch immer weiter noch ausweiten. Man hat es jetzt schon die letzten Jahre gesehen, dass vor allem auch Apple sehr stark eine vorreitende Rolle spielt, die ja auch überhaupt sehr viele Bedienhilfen in ihre Betriebssysteme integrieren. Und auch die Sprachsteuerung entwickeln sich da immer noch weiter. Google ist auch sehr, sehr stark in Spracherkennung wäre das mal selber probieren will vielleicht, sich einfach mal sein Handy schnappen und dann einfach mal nur die Diktierfunktion probieren und da merkt man dann schon relativ schnell, dass die Spracheingabe in der reinen Geschwindigkeit, wie man den Satz diktiert, eigentlich schneller sind, als man es mit einer Tastatur machen kann. Und also, wenn die Entwicklung Weiter-so fortschreitet, dann kann ich mir auch gut vorstellen, dass viele Leute das auch einfach so benutzen werden.
Dennis Bruder: Ja, dann sind wir eigentlich auch schon mit der kurzen Vorstellung von Sprachbedienungen, und für wen Sprachbedienungen auch hilfreich und geeignet sein können durch. Wir werden noch ein paar links in die Schauen setzen zu Bedienungshilfen und zu hinweisen, zu Bedienungshilfen am Handy, am Computer, am Mac, und wir werden auch ein paar Sprachprogramme, die es so auf dem Markt gibt, noch verlinken in den Schauen. Also, es lohnt sich, da vielleicht mal reinzuschauen. Dann bedanke ich mich bei dir, Thomas, für das kurze Interview.
Thomas Ernst: Ja, danke, gerne, dir auch danke.
Dennis Bruder: Das war es auch wieder mit dieser Folge von Barrierelos, dem Podcast zur digitalen Barrierefreiheit. Wenn ihr Fragen zum Thema digitale Barrierefreiheit habt, dann kommt auch auf die Webseite der Beratungsstelle, also Beratungsstelle minus Barrierefreiheit, und dort könnt ihr euch unter anderem zur digitalen Barrierefreiheit bei uns informieren. Dann bis zur nächsten Folge von Barriere los!
Abonnieren Sie unseren Podcast auf den bekannten Podcast-Plattformen:
Amazon Music, Apple Podcast und Spotify
Die Kommentarfunktion ist für diesen Artikel deaktiviert.