Il colosso tecnologico Microsoft recentemente svelato la sua nuovissima tecnologia di intelligenza artificiale (AI).
Sommario
VALLE
Detto VALLE, si dice che questo modello di intelligenza artificiale sia in grado di analizzare e replicare le voci delle persone avendo bisogno solo di una registrazione di 3 secondi di una determinata voce per imitarla. Quando una certa voce è stata simulata con successo, VALL-E può cambiare l'intonazione in base al tono emotivo di quella persona.
I suoi creatori spiegano che il VALL-E è stato addestrato con 60,000 ore di parlato inglese da oltre 7,000 parlanti diversi, nel tentativo di convincerlo a produrre un parlato dal suono umano.
Copia qualsiasi voce in 3 secondi
I ricercatori che hanno sviluppato VALL-E hanno spiegato che questa tecnologia potrebbe essere utilizzata in applicazioni di sintesi vocale per produrre voci basate su trascrizioni preparate. L'utente dovrà quindi solo preparare uno script contenente ciò che vuole trasmettere senza dover registrare manualmente la propria voce. È considerato molto utile per attività come la modifica di discorsi e la creazione di contenuti audio.
VALL-E può essere pericoloso
Sebbene il potenziale per intelligenza artificiale può variare, molte persone sono preoccupate per l'impatto negativo che VALL-E potrebbe comportare. VALL-E comporta il rischio di abusi che potrebbero criminalizzare i suoi utenti, ad esempio se la tecnologia viene utilizzata per falsificare l'identificazione vocale o impersonare determinati interlocutori.
Ad esempio, questa intelligenza artificiale è stata utilizzata per falsificare la voce di una persona famosa che diceva qualcosa che non aveva mai detto. Questo tipo di casi sono stati trovati nei deepfake in formato video.
Inoltre, è quasi simile a AI dell'obiettivo, che recentemente è stato considerato una violazione dell'etica dell'arte perché si teme che possa sostituire gli artisti umani realizzando arte digitale.
I produttori musicali lo usano per copiare le voci dei cantanti
VALL-E solleva anche questioni etiche, come quando L'intelligenza artificiale viene utilizzata dalle società di produzione musicale per cantare nuove canzoni senza il consenso del cantante che possiede la voce.
Rendendosi conto delle preoccupazioni e dei possibili rischi che il robot potrebbe comportare, Microsoft, in qualità di sviluppatore, pubblica solo le capacità e il funzionamento del modello di intelligenza artificiale senza condividere il codice sorgente.
I ricercatori di VALL-E affermano che cercheranno di costruire un meccanismo di misurazione in grado di prevenire tali rischi, ad esempio un metodo in grado di rilevare una clip audio progettata da VALL-E o il suono originale.
Cos'è Microsoft VALL-E?
Il modello Microsoft VALL-E è progettato per comprendere il linguaggio naturale.
Come funziona Microsoft VALL-E?
Per comprendere il linguaggio naturale, Microsoft VALL-E utilizza tecniche di deep learning.
Quali sono le funzionalità di Microsoft VALL-E?
Utilizzando l'input in linguaggio naturale, Microsoft VALL-E può completare immissioni di testo, rispondere a domande e conversare in modo naturale.
Quali sono le applicazioni di Microsoft VALL-E?
Oltre ai chatbot e alle interfacce basate sulla lingua, Microsoft VALL-E può essere utilizzato anche nelle applicazioni del servizio clienti.
Microsoft VALL-E è open source?
T5 e GPT-3 sono altri modelli linguistici Microsoft open source. La disponibilità di Microsoft VALL-E potrebbe essere cambiata. Agisci direttamente o controlla il sito Web ufficiale di Microsoft.