Die Parrotron AI von Google hilft Sprachgestörten frei zu sprechen
19. Juli 2019Die Parrotron AI von Google hilft Sprachgestörten frei zu sprechen
New York, 19.7.2019
In einem neuen Blogbeitrag präsentierte das Big G eine neue Speech-to-Text-Technologie, die speziell für Menschen mit verbalen Beeinträchtigungen und atypischen Sprachmustern entwickelt wurde. Die Software, die als Parrotron bezeichnet wird, läuft auf einem tiefen neuronalen Netzwerk, das darauf ausgelegt ist, atypische Sprachmuster in flüssige synthetisierte Sprache umzuwandeln.
Besonders interessant ist, dass die Technologie nicht auf visuelle Hinweise wie Lippenbewegungen angewiesen ist. Um dies zu erreichen, speiste Google das neuronale Netzwerk mit einem „Korpus von[fast] 30.000 Stunden, der aus Millionen von anonymisierten Äußerungspaaren besteht“.
Die Technologie reduziert „die Wortfehlerquote für einen Gehörlosen von 89 Prozent auf 25 Prozent“, aber Google hofft, dass die laufende Forschung die Ergebnisse noch weiter verbessern wird.
Die Forscher haben ein paar Demo-Videos zum download frei gegeben, auf denen die erzielten Fortschritte gezeigt werden.
Du kannst sie dir ansehen:blog here.
Für eine detailliertere Darstellung der Technologie hinter Parrotron besuchen Sie bitte Googles Blog
Die vollständige Forschung wurde auf ArXiv, veröffentlicht, während Sie weitere Beispiele für Parrotron in Aktion in diesem GitHub repository finden können.