Kürzlich hat Google ein KI-System entwickelt, das in der Lage ist, Musik nach einer Textbeschreibung zu erstellen. Dies folgt dem Trend, dass KI zum Generieren von Bildern verwendet wird und Menschen beim Verfassen schriftlicher Arbeiten hilft.
Google, der Online-Such- und Werbegigant, nannte dieses System „MusicLM“. Ein akademische Abhandlung Januar von den Google-Forschern veröffentlicht, erklärt MusicLM als „ein Modell, das hochwertige Musik aus Textbeschreibungen erzeugt, wie z. B. ‚eine beruhigende Geigenmelodie, ergänzt durch ein verzerrtes Gitarrenriff‘“.
Das Papier besagt, dass MusicLM nachweislich in der Lage ist, sich sowohl an eine Textunterschrift als auch an eine Melodie anzupassen, sei es ein Summen oder ein Pfeifen.
Das Papier gibt an, dass MusicLM mit benutzergenerierten Beschreibungen gefüttert werden kann, zum Beispiel „bezaubernder Jazz-Track mit einprägsamem Saxophon-Solo und einem Sänger“ oder „Berliner 90er-Techno, begleitet von tiefem Bass und festem Kick“, und trotzdem das Recht zurückgeben Ergebnisse.
Man kann einige der mit MusicLM erstellten Melodien hören hier.
Das schnelle Wachstum von ChatGPT von OpenAI, einem auf künstlicher Intelligenz basierenden Tool zur Verarbeitung natürlicher Sprache, hat Google veranlasst, Maßnahmen zu ergreifen, wobei Berichte der Unternehmensleitung laut The New York Times einen „Code Red“ erklärt haben. Als Reaktion darauf bereitet sich Google angeblich darauf vor, im Jahr 2021 mehr als 20 KI-basierte Projekte vorzustellen, darunter eine Version der Google-Suche, die KI-Technologie enthält.
TechCrunch erwähnt, dass MusicLM nicht der einzige KI-Musikgenerator ist, da andere Projekte wie Riffus, Dance Diffusion, Googles AudioLM und OpenAIs Jukebox dasselbe Feld erforscht haben.
Es ist unwahrscheinlich, dass MusicLM bald der Öffentlichkeit zugänglich sein wird, da Bedenken hinsichtlich der Möglichkeit von Programmierfehlern bestehen, die zu technologischen Problemen, mangelnder Darstellung und Missbrauch kreativer Inhalte führen. Zur Veranschaulichung entdeckte das Forschungsteam von Google während eines Versuchs, dass ein Prozent der von MusicLM produzierten Musik mit den Songs identisch war, mit denen es trainiert wurde.
Es ist möglich, das Plagiatsrisiko zu verringern, indem man die Struktur eines Textes ändert, während sein kontextueller und semantischer Inhalt erhalten bleibt. Dies kann erreicht werden, indem die Wörter, Phrasen und Sätze neu angeordnet werden, während die ursprüngliche Bedeutung erhalten bleibt.