Der Tech-Gigant Microsoft kürzlich enthüllt seine brandneue Technologie der künstlichen Intelligenz (KI).
Inhaltsverzeichnis
SENKE
Genannt SENKE, soll dieses KI-Modell sein in der Lage, die Stimmen von Menschen zu analysieren und zu replizieren, indem nur eine 3-Sekunden-Aufnahme einer bestimmten Stimme benötigt wird, um sie zu imitieren. Wenn eine bestimmte Stimme erfolgreich simuliert wurde, kann VALL-E die Intonation an den emotionalen Ton dieser Person anpassen.

Seine Schöpfer erklären, dass das VALL-E mit 60.000 Stunden englischer Sprache von über 7.000 verschiedenen Sprechern trainiert wurde, um es dazu zu bringen, menschlich klingende Sprache zu produzieren.
Kopieren Sie jede Stimme in 3 Sekunden
Forscher, die VALL-E entwickelt haben, erklärten, dass diese Technologie in verwendet werden könnte Text-to-Speech-Anwendungen, um Stimmen auf der Grundlage vorbereiteter Transkripte zu erzeugen. Der Benutzer muss also nur ein Skript erstellen, das enthält, was er vermitteln möchte, ohne seine Stimme manuell aufnehmen zu müssen. Es wird als sehr hilfreich für Aktivitäten wie das Bearbeiten von Reden und das Erstellen von Audioinhalten angesehen.

VALL-E kann gefährlich sein
Obwohl das Potenzial für künstliche Intelligenz variieren können, sind viele Menschen besorgt über die negativen Auswirkungen, die VALL-E möglicherweise hervorrufen könnte. VALL-E birgt das Risiko des Missbrauchs, der seine Benutzer kriminalisieren könnte, z. B. wenn die Technologie verwendet wird, um die Spracherkennung zu fälschen oder sich als bestimmte Sprecher auszugeben.
Zum Beispiel wurde diese KI verwendet, um die Stimme einer berühmten Person vorzutäuschen, die etwas sagte, was sie nie gesagt hatte. Diese Art von Fall wurde bei Deepfakes im Videoformat gefunden.
Darüber hinaus ist es fast ähnlich wie AI-Objektiv, das kürzlich als Verstoß gegen die Kunstethik angesehen wurde, weil befürchtet wird, dass es menschliche Künstler durch die Herstellung digitaler Kunst ersetzen kann.
Musikproduzenten verwenden es, um die Stimmen von Sängern zu kopieren
VALL-E wirft auch ethische Fragen auf, etwa wann KI wird von Musikproduktionsfirmen verwendet, um neue Songs ohne die Zustimmung des Sängers zu singen, dem die Stimme gehört.
Angesichts der Bedenken und möglichen Risiken, die der Roboter mit sich bringen könnte, veröffentlicht Microsoft als Entwickler nur die Fähigkeiten und Funktionsweisen des KI-Modells, ohne den Quellcode zu teilen.
Die Forscher von VALL-E sagen, dass sie versuchen werden, einen Messmechanismus zu entwickeln, der solche Risiken verhindern kann, wie zum Beispiel eine Methode, die dies kann einen von VALL-E erstellten Audioclip erkennen oder der Originalton.
Was ist Microsoft VALL-E?
Das Microsoft VALL-E-Modell wurde entwickelt, um natürliche Sprache zu verstehen.
Wie funktioniert Microsoft VALL-E?
Um die natürliche Sprache zu verstehen, verwendet Microsoft VALL-E Deep-Learning-Techniken.
Was sind die Fähigkeiten von Microsoft VALL-E?
Mithilfe der Eingabe in natürlicher Sprache kann Microsoft VALL-E Texteingaben vervollständigen, Fragen beantworten und sich auf natürliche Weise unterhalten.
Was sind die Anwendungen von Microsoft VALL-E?
Neben Chatbots und sprachbasierten Schnittstellen kann Microsoft VALL-E auch in Kundenservice-Anwendungen eingesetzt werden.
Ist Microsoft VALL-E Open Source?
T5 und GPT-3 sind andere Open-Source-Sprachmodelle von Microsoft. Die Verfügbarkeit von Microsoft VALL-E hat sich möglicherweise geändert. Sie handeln direkt oder besuchen Sie die offizielle Microsoft-Website.
Abonnieren Sie, um die neuesten Technologie-Updates zu erhalten!"