Meta will mit KI- Framework bessere Spracherkennung erreichen

Meta will mit KI- Framework bessere Spracherkennung erreichen

12. Januar 2022 0 Von Horst Buchwald

Meta will mit KI- Framework bessere Spracherkennung erreichen

San Francisco, 12.1.2022

Meta AI kündigte ein KI-Framework für Konversationen an, das KI-Assistenten „näher an die menschliche Sprachwahrnehmung heranbringen“ soll.

Das System mit der Bezeichnung Audio-Visual Hidden Unit BERT ( AV-HuBERT ) könne zum Beispiel Smartphone-Assistenten helfen, besser zu verstehen, was Nutzer in Menschenmengen zu ihnen sagen.

Das Framework soll zudem bei der Entwicklung von Spracherkennungssystemen helfen, die nicht so stark durch Geräusche beeinträchtigt werden. Das System lernt Sprache nicht nur, indem es Menschen sprechen hört, sondern indem es ihre Lippenbewegungen sieht.

AV-HuBERT fügt dem Prozess die visuelle Komponente hinzu und erfasst laut Meta „nuancierte Assoziationen“ zwischen visuellen und akustischen Eingaben selbst mit sehr kleinen Mengen an nicht transkribierten Videodaten für das Vortraining.

AV-HuBERT benötigt weit weniger beschriftete audiovisuelle Daten als andere Systeme, um die gleichen Ergebnisse zu erzielen. Dank der geringeren Datenmenge ist es laut Meta in der Lage, Spracherkennungssysteme in mehreren Sprachen zu erstellen.