Wird Googles AudioLM die Welt der Musik bereichern?

8. Oktober 2022 0 Von Horst Buchwald

San Francisco, 8.10. 2022

Google-Forscher haben AudioLM entwickelt, ein KI-System, das ähnlich klingende Lieder und Sprache aus nur wenigen Sekunden Audio generiert. AudioLM ist noch nicht für die Öffentlichkeit zugänglich. Die Technik ähnelt Sprachmodellen, da sie auf der Grundlage einer Aufforderung vorhersagt, was als Nächstes kommen soll.

AudioLM kann Klänge wie Sprache und Klaviermusik erzeugen, die von den Originalaufnahmen kaum zu unterscheiden sind. Laut Google könnte es den KI-Trainingsprozess für die Audiogenerierung beschleunigen und schließlich automatisch Musik zur Untermalung von Videos generieren.

Im Gegensatz zu aktuellen Systemen, die sich auf textbasierte Daten stützen, erfordert AudioLM keine vorherige Kennzeichnung oder Transkription. Es kann Tonhöhe, Klangfarbe, Intensität und Artikulation eines Tons sowie Hintergrundgeräusche und Atemgeräusche des Sprechers imitieren.

Google hat Beispiele auf seiner AudioLM-Website veröffentlicht. Eine Beschreibung des Frameworks ist auf dem Google AI Blog verfügbar.

KategorieHeader