Spracherkennung: TU Dresden präsentiert neue Erkenntnisse

Medialer Kniehöcker im Blick
FT
medialer Kniehöcker
Darstellung des medialen Kniehöckers im Gehirn von menschlichen Testpersonen. Der mediale Kniehöcker ist Teil der Hörbahn. Er ist so organisiert, dass bestimmte Abschnitte bestimmte Tonfrequenzen repräsentieren. TU Dresden
Newsletter­anmeldung

Bleiben Sie auf dem Laufenden. Der MT-Dialog-Newsletter informiert Sie jede Woche kostenfrei über die wichtigsten Branchen-News, aktuelle Themen und die neusten Stellenangebote.


Neurowissenschaftler von der Technischen Universität in Dresden haben in einer neuen Studie gezeigt, dass die Spracherkennung bei Menschen nicht ausschließlich in der Großhirnrinde beginnt, sondern bereits in den Leitungsbahnen vom Ohr zur Großhirnrinde.

„Siri, wie wird morgen das Wetter?“ Sprachassistenten nehmen heute bereits einen großen Teil in vielen Haushalten ein. Sie schalten Geräte ein und aus, melden sich bei neuen E-Mails und berichten über Nachrichten aus der ganzen Welt. Die Spracherkennung dieser Systeme basiert zumeist auf maschinellem Lernen, einem Teilgebiet der künstlichen Intelligenz. Die Maschine generiert ihr Wissen aus immer wiederkehrenden Mustern von Daten. Durch den Einsatz von künstlichen neuronalen Netzwerken konnte die computerbasierte Spracherkennung in den vergangenen Jahren um ein Vielfaches verbessert werden.

Genaue Abläufe noch weitgehend unbekannt

Für Neurowissenschaftlerin Professorin Katharina von Kriegstein bleibt das menschliche Gehirn jedoch nach wie vor die „bewunderungswürdigste Sprachverarbeitungs-Maschine“. „Es funktioniert viel besser als computerbasierte Sprachverarbeitung und das wird wohl auch noch eine ganze Zeit lang so bleiben“, erklärt von Kriegstein, „denn die genauen Abläufe der Sprachverarbeitung im Gehirn sind bisher noch weitestgehend unbekannt“.

Nutzung funktioneller MRT

Die Neurowissenschaftlerin und ihr Team entdeckten nun in einer aktuellen Studie einen weiteren Baustein in dem Rätsel der menschlichen Sprachverarbeitung. 33 Versuchspersonen wurden mit Hilfe von funktioneller Magnetresonanztomografie (MRT) untersucht und bekamen Sprachsignale verschiedener Sprecherinnen und Sprecher zu hören. Dabei sollten die Probanden in wechselnder Reihenfolge eine Sprachaufgabe oder eine Kontrollaufgabe zur Stimmerkennung durchführen. Mit Hilfe der MRT wurde die Gehirnaktivität der Testpersonen aufgenommen. Die Aufnahmen zeigten, dass eine Struktur in der linken Hörbahn – der mediale Kniehöcker – besonders hohe Aktivität leistet, wenn die Versuchspersonen eine Sprachaufgabe durchführen (im Gegensatz zu der Kontrollaufgabe) und wenn die Versuchspersonen besonders gut im Erkennen von Sprache sind.

Medialer Kniehöcker spielt größere Rolle

Bis dato nahm man an, dass alle Hörinformationen im selben Maße über die Hörbahnen vom Ohr zur Großhirnrinde geleitet werden. Die neuerlichen Aufnahmen der erhöhten Aktivität des medialen Kniehöckers zeigen nun, dass die Verarbeitung der Hörinformation bereits beginnt, bevor die Leitungsbahnen die Großhirnrinde erreichen. Katharina von Kriegstein erläutert die Ergebnisse so: „Wir haben schon seit einiger Zeit erste Hinweise darauf, dass die Hörbahnen spezialisierter auf Sprache sind, als bisher angenommen. Diese Studie zeigt nun, dass dies tatsächlich der Fall ist: Der Teil des medialen Kniehöckers, der die Information vom Ohr zu der Großhirnrinde transportiert, verarbeitet Hörinformation anders, wenn Sprache erkannt werden soll, als wenn andere Bestandteile von Kommunikationssignalen erkannt werden sollen, wie zum Beispiel die Stimme des Sprechers.“

Das Erkennen und Aufnehmen von akustischer Sprache ist für die zwischenmenschliche Kommunikation ziemlich wichtig. Das Verständnis über die zugrundeliegenden neuronalen Prozesse wird nicht nur für die Weiterentwicklung computerbasierter Spracherkennung von Bedeutung sein.

Weitere Studien zu LRS geplant

Die aktuellen Ergebnisse haben möglicherweise auch Relevanz für einige der Symptome einer Lese- und Rechtschreibstörung (LRS). Es ist bekannt, dass der linke mediale Kniehöcker bei LRS anders funktioniert, als bei Testpersonen ohne LRS. Die Spezialisierung des linken medialen Kniehöckers auf Sprache könnte somit eventuell erklären, wieso Personen, die an LRS leiden, häufig Schwierigkeiten haben, Sprachsignale in geräuschvollen Umgebungen zu verstehen. Um diese Hinweise auch wissenschaftlich zu belegen, will das Team um Katharina von Kriegstein weitere Studien durchführen.

Quelle: TU Dresden

Literatur:

Paul Glad Mihai, Michelle Moerel, Federico de Martino, Robert Trampel, Stefan Kiebel, Katharina von Kriegstein: Modulation of tonotopic ventral MGB is behaviourally relevant for speech recognition. eLife 2019; 8: e44837, DOI: 10.7554/eLife.44837

Artikel teilen

Online-Angebot der MT im Dialog

Um das Online-Angebot der MT im Dialog uneingeschränkt nutzen zu können, müssen Sie sich einmalig mit Ihrer DVTA-Mitglieds- oder Abonnentennummer registrieren.

Stellen- und Rubrikenmarkt

Möchten Sie eine Anzeige in der MT im Dialog schalten?

Stellenmarkt
Industrieanzeige