Spleeter jetzt als Open-Source – Paket veröffentlicht
7. November 2019Spleeter jetzt als Open-Source – Paket veröffentlicht
New York, 7.11.2019
Die Aufteilung eines Songs in einzelne Vocals und Instrumente war schon immer ein Problem für Produzenten, DJs und alle anderen, die mit isoliertem Audio spielen wollen. Es gibt viele Möglichkeiten, dies zu tun, aber der Prozess kann zeitaufwendig und die Ergebnisse oft unvollkommen sein. Ein neues Open-Source-KI-Tool macht diese knifflige Aufgabe schneller und einfacher.
Die Software heißt Spleeter und wurde vom Musik-Streaming-Dienst Deezer für Forschungszwecke entwickelt. Gestern hat das Unternehmen es als Open-Source-Paket veröffentlicht, das den Code auf Github für jeden zum Herunterladen und Verwenden bereitstellt. Füttern Sie Spleeter mit einer Audiodatei und es (spleets) teilt sie in zwei, vier oder fünf separate Audiospuren, die als Stile bekannt sind. Die Ergebnisse sind nicht perfekt, aber sie sind hervorragend verwendbar und Spleeter selbst ist sehr schnell. Wenn es auf einem dedizierten Grafikprozessor läuft, kann es Audiodateien 100-mal schneller als in Echtzeit in vier Abschnitte aufteilen.
Dieses Tool ist sehr leistungsfähig , aber seien Sie gewarnt: Sie benötigen einige technische Kenntnisse, um es zu nutzen. Wenn Sie nicht regelmäßig mit Software wie Python oder Googles KI-Toolkit TensorFlow (mit dem Spleeter trainiert wurde) spielen, müssen Sie einige Programme herunterladen, um alles zum Laufen zu bringen. Und Sie müssen sich mit der Verwendung einer Befehlszeilen-Eingabe (wenn auch einer sehr einfachen) anstelle einer besser zugänglichen visuellen Oberfläche auskennen.
Deezer stellt fest, dass dies nicht das erste Mal ist, dass Menschen maschinelles Lernen zur Automatisierung dieser Aufgabe einsetzen, und dass die Erfolge des Unternehmens auf vielen früheren Forschungen basieren. Im Gespräch mit The Verge über E-Mail sagt Aurelien Herault, Chief Data and Research Officer von Deezer, dass das Unternehmen seine Software auf 20.000 Musikstücken mit vorisoliertem Gesang in einer Vielzahl von Genres trainiert hat. Aus diesen Informationen lernte die Software, wie man die Spuren selbst isoliert.
Insgesamt ist Spleeter ein weiteres fantastisches Beispiel dafür, wie KI-Tools knifflige Teile der kreativen Arbeit vereinfachen können. Das maschinelle Lernen wird derzeit zur Automatisierung einer Reihe von zeitaufwändigen Aufgaben eingesetzt, von der Entfernung von Hintergründen auf Bildern bis hin zur Hochskalierung von Texturen in alten Videospielen. Und zunehmend werden diese Tools in die Consumer-Software integriert, vom Adobe Photoshop bis hin zu neuen Konkurrenten wie Runway ML.
removing backgrounds on pictures to upscaling textures
Deezer sagt, dass es keine Pläne hat, Spleeter in ein Verbraucherwerkzeug zu verwandeln, aber andere könnten ihre Arbeit nehmen und eine einfache Schnittstelle darauf schlagen.
Deezer selbst nutzt Spleeter für eine Reihe von Forschungsanwendungen, die zur Verbesserung des Streaming-Service beitragen. „Intern nutzen wir es als Vorverarbeitungswerkzeug für komplexe Forschungsaufgaben wie Musikkategorisierung, Transkription und Spracherkennung“, sagt Herault.
Oder du kannst es natürlich auch einfach benutzen, um den Scatman besser in den Griff zu bekommen. Ski-bi dibby dibby dib yo da dub dub.