28.10.2016

Eigene Computerstimme spornt an

Die eigene synthetisierte Stimme wirkt sich positiv auf das Lernverhalten von blinden oder sehbehinderten Kindern aus. Das hat ein Team von Schallforscher/innen der ÖAW herausgefunden und erhielt dafür den Inklusions-Wissenschaftspreis.

Bild: Shutterstock/Woters
Bild: Shutterstock/Woters

Knapp zwei Meter mal zwei Meter und ziemlich beige. Man hört kein Rauschen, die Stille drückt dumpf auf die Ohren. Das sind die Labore von Michael Pucher am Institut für Schallforschung der Österreichischen Akademie der Wissenschaften (ÖAW) in Wien. Hier nahmen schon namhafte Sprecher wie Stephan Pokorny vor dem Mikrofon Platz – für ein kürzlich ausgezeichnetes Forschungsprojekt erstmals auch 20 Schüler/innen des Bundes-Blindenerziehungsinstituts in Wien.

Die blinden oder sehbehinderten Kinder im Alter von zehn Jahren haben in ihrem Schulalltag laufend mit hörbaren Mathe- und Deutschaufgaben zu tun, die ihnen von synthetisierten Frauen- und Männerstimmen erklärt werden. Was aber, wenn sie dabei ihre eigene Stimme als Computerstimme hören könnten – würde es einen Unterschied machen? Diese Frage stellte sich der Informatiker Pucher gemeinsam mit seinem Forschungsteam. „Es gab schon einige Untersuchungen dazu, wie man Stimmen von Personen wahrnimmt, die man kennt. Welche Auswirkungen die eigene Stimme auf die Leistung oder Konzentration hat, war bis dahin aber noch nicht bekannt“, erklärt Pucher.

Erstellen einer Computerstimme

Um das zu erforschen, mussten die Wissenschaftler/innen mit jedem Kind alle möglichen Lautvariationen und -kombinationen aufnehmen, die es in der deutschen Sprache gibt. Verpackt wurden sie in knapp 300 abwechslungsreichen Sätzen. „Für einen A-Laut in einer bestimmten Lautumgebung zum Beispiel brauchen wir je fünf verschiedene Modelle hinsichtlich der Länge, Frequenz und der Tonhöhe des Lautes“, erläutert Pucher. Mit sämtlichen Konsonanten und Vokalen auf Band, kann eine Software daraus beliebige Wörter bauen und somit jeden digitalen Text von dieser Stimme lesen lassen.

Es folgte ein zweitägiger Workshop im Festsaal des Bundes-Blindenerziehungsinstituts, in dem die Kinder von Pucher etwas über Sprachtechnologie und Phonetik lernten und zudem kleinere Computerspiele wie Tastenmemory spielten – natürlich nur für Forschungszwecke. Die Schallexpert/innen wollten durch dieses Spiel erfahren, wie schnell die Kinder die richtigen Paare zusammenfinden können, wenn sie dabei von ihrer eigenen oder einer fremden Computerstimme angeleitet werden. „Wir wussten anfangs nicht, ob es überhaupt einen Unterschied machen würde“, sagt ÖAW-Wissenschaftler Pucher. Doch es machte einen. Und zwar benötigten die Kinder unter Anleitung ihrer eigenen synthetischen Stimme im Schnitt um zwei Züge weniger, um alle vier Paare zusammenzufinden, die sich hinter den Computertasten ASDF-JKLÖ versteckten.

Auch länger konzentriert?

Mit einem kniffligen Computer-Labyrinth wollten die Schallforscher/innen zudem untersuchen, ob sich die eigene Computerstimme auch positiv auf die Aufmerksamkeit und Motivation der Kinder auswirken kann. „Die Räume, die wir für die Kinder gebaut haben, waren weder physikalisch realistisch noch logisch – man verließ beispielsweise die Turnhalle und fand sich im Cockpit eines Flugzeuges wieder“, erzählt der Informatiker. Tatsächlich blieben die Schüler/innen doppelt so lange bei der Sache, wenn sie von ihrer eigenen künstlichen Stimme gelotst wurden.

Warum das so ist, kann sich der Schallforscher noch nicht erklären. Fest steht jedoch, dass die positiven Effekte eher unbewusst eintraten. Denn keines der Kinder erkannte seine eigene Stimme während des Spielens. "Erst als wir danach alle zusammensaßen und uns die Stimmen gemeinsam anhörten, um sie den jeweiligen Schülerinnen und Schüler zuzuordnen, erkannten sie ihre eigenen Stimmen und konnten die der anderen richtig zuordnen."

Schnellsprechtest für neue Software

Für einen dritten Test ertönte die bekannte Stimme von Stephan Pokorny aus den Kopfhörern. Dieser sollten die Kinder genau zuhören und die Sätze anschließend in den Computer tippen. Das Schwierige dabei: kurze, kindgerechte Phrasen wie „Warum lachst du so?“ oder „Der Pinguin ist ein Vogel“ wurden unterschiedlich schnell abgespielt – manche zu schnell. „Wir haben damit eine neue Software getestet, die die Dauer der Laute nicht wie üblich linear ändert, um den Satz schneller zu machen, sondern sich dabei an unser natürliches Schnellsprechverhalten anpasst“, erklärt Pucher. Wenn wir schneller sprechen, variieren wir die Sprache nicht-linear – setzen an anderen Stellen Pausen und beschleunigen bei manchen Worten und Lauten besonders. „Die neue Software führt zu einer besseren Verständlichkeit, wenn der für die Synthese verwendete Sprecher gut ist und keine Laute verschluckt, wenn wir die schneller gesprochenen Datensätze aufnehmen, die der Computer dann adaptiert und variiert“, so Pucher weiter.

Der Test brachte den Forscher/innen aber noch eine weitere Erkenntnis, nämlich um wie viel besser Sehbehinderte und Blinde schnell abgespielte Sprache verstehen. Zum Teil wenden sie diese Fähigkeit täglich an. „Unsere Vergleichsgruppe mit Menschen, die sehen konnten, machte viel mehr Fehler. Die besten hatten nur 20 bis 40 Prozent richtige Wörter. Den Rekord stellte ein junger sehbehinderter Schüler auf, der 57 Prozent der Wörter richtig schrieb.“

Ausgezeichnete Grundlagenforschung

Mit diesen Forschungsergebnissen überzeugten die Schallexpert/inneen auch die Jury des Wissenschaftspreises für Inklusion durch Naturwissenschaft und Technik – kurz WINTEC. Dieser wird jährlich vom österreichischen Sozialministerium vergeben. Pucher und sein Team erreichten dabei den dritten Platz.

 

 

 

 

Michael Pucher

ist seit 2016 Senior Research Scientist am Institut für Schallforschung der ÖAW

in Wien. Zuvor war der Informatiker als wissenschaftlicher Mitarbeiter am Forschungszentrum

Telekommunikation Wien (FTW) tätig. Forschungsaufenthalte führten ihn u.a. an

das japanische National Institute of Informatics in Tokio, das International Computer

Science Institute im kalifornischen Berkeley und das Centre for Speech

Technology Research an der Universität Edinburgh. Er unterrichtet an der TU

Wien.

INSTITUT FÜR SCHALLFORSCHUNG DER ÖAW