Google: MusicLM produziert nach Texteingabe Musik

Google: MusicLM produziert nach Texteingabe Musik

30. Januar 2023 0 Von Horst Buchwald

Google: MusicLM produziert nach Texteingabe Musik

San Francisco, 30.1.2023

Google-Forscher stellten ein neues KI-System vor, das Musik aus Textbeschreibungen generiert. Das neue Modell mit dem Namen MusicLM übertraf andere KI-Musikgeneratoren sowohl in der Audioqualität als auch in seiner Fähigkeit, sich an die Eingabeaufforderungen zu halten. Aus urheberrechtlichen Gründen wird Google MusicLM noch nicht veröffentlichen.

MusicLM wurde mit über 280.000 Stunden Musik trainiert, wodurch es in der Lage ist, Tracks verschiedener Genres, Instrumente und Konzepte zu produzieren. Benutzer geben eine Beschreibung in natürlicher Sprache ein, welche Musik sie möchten, einschließlich der Anzahl der Instrumente, und das System gibt High-Fidelity-Audio aus. Benutzer können auch singen, pfeifen oder summen, um auf einer Melodie aufzubauen. Das Modell „erzeugt Musik bei 24 kHz, die über mehrere Minuten konstant bleibt“, so die Forscher.

Das System basiert auf der neuronalen Netzwerkarchitektur Transformer von Google, die sich besonders in den KI-Bereichen der Verarbeitung natürlicher Sprache und Computer Vision als nützlich erwiesen hat.

Google-Forscher veröffentlichten auch einen KI-Trainingsdatensatz mit 5.500 Musikstücken, um andere Forscher zu unterstützen, die an der automatisierten Songgenerierung arbeiten