Kürzlich hat Google ein KI-System entwickelt, das in der Lage ist, Musik anhand einer Textbeschreibung zu erstellen. Dies folgt dem Trend, KI sowohl zur Generierung von Bildern als auch zur Unterstützung beim Verfassen schriftlicher Arbeiten einzusetzen.
Google, der Online-Such- und Werbegigant, nannte dieses System „MusicLM“. Ein akademisches Papier Das am 26. Januar von Google-Forschern veröffentlichte Dokument beschreibt MusicLM als „ein Modell, das aus Textbeschreibungen hochwertige Musik erzeugt, wie zum Beispiel ‚eine beruhigende Geigenmelodie, ergänzt durch ein verzerrtes Gitarrenriff‘.“
In dem Dokument heißt es, dass MusicLM nachweislich in der Lage sei, sich sowohl an eine Textbeschriftung als auch an eine Melodie anzupassen, sei es ein Summen oder ein Pfeifen.
In dem Papier heißt es, dass MusicLM mit benutzergenerierten Beschreibungen gefüttert werden kann, zum Beispiel „bezaubernder Jazz-Track mit einem einprägsamen Saxophon-Solo und einem Sänger“ oder „Berliner 90er-Jahre-Techno, begleitet von tiefem Bass und kräftigem Kick“, und trotzdem das Recht zurückgibt Ergebnisse.
Man kann einige der mit MusicLM erstellten Melodien hören hier.
Das schnelle Wachstum von OpenAIs ChatGPT, einem auf künstlicher Intelligenz basierenden Tool zur Verarbeitung natürlicher Sprache, hat Google dazu veranlasst, Maßnahmen zu ergreifen. Berichten zufolge hat die Unternehmensleitung laut The New York Times einen „Code Red“ erklärt. Als Reaktion darauf bereitet Google angeblich die Vorstellung von mehr als 20 KI-basierten Projekten im Jahr 2021 vor, darunter eine Version der Google-Suche, die KI-Technologie integriert.
TechCrunch erwähnt, dass MusicLM nicht der einzige KI-Musikgenerator ist, da andere Projekte wie Riffusion, Dance Diffusion, Googles AudioLM und OpenAIs Jukebox das gleiche Gebiet erforscht haben.
Es ist unwahrscheinlich, dass MusicLM bald für die Öffentlichkeit zugänglich sein wird, da man befürchtet, dass Programmiervoreingenommenheiten zu technologischen Problemen, mangelnder Darstellung und Missbrauch kreativer Inhalte führen könnten. Zur Veranschaulichung: Während eines Versuchs stellte das Forschungsteam von Google fest, dass ein Prozent der von MusicLM produzierten Musik mit den Liedern identisch war, mit denen es trainiert wurde.
Durch die Veränderung der Struktur eines Textes unter Beibehaltung seines kontextuellen und semantischen Inhalts lässt sich das Plagiatsrisiko verringern. Dies kann erreicht werden, indem die Wörter, Phrasen und Sätze neu angeordnet werden, wobei die ursprüngliche Bedeutung erhalten bleibt.