Il gigante della tecnologia Microsoft recentemente svelato la sua nuovissima tecnologia di intelligenza artificiale (AI).
Sommario
VALL-E
Di nome VALL-E, si dice che questo modello di intelligenza artificiale sia in grado di analizzare e replicare le voci delle persone richiedendo solo una registrazione di 3 secondi di una certa voce per imitarla. Quando una certa voce è stata simulata con successo, VALL-E può cambiare l'intonazione al tono emotivo di quella persona.

I suoi creatori spiegano che il VALL-E è stato addestrato con 60.000 ore di parlato in inglese da oltre 7.000 parlanti diversi nel tentativo di fargli produrre un discorso dal suono umano.
Copia qualsiasi voce in 3 secondi
I ricercatori che hanno sviluppato VALL-E hanno spiegato che questa tecnologia potrebbe essere utilizzata in applicazioni di sintesi vocale per produrre voci basate su trascrizioni preparate. Quindi, il suo utente deve solo preparare uno script contenente tutto ciò che vuole trasmettere senza dover registrare manualmente la sua voce. È considerato molto utile per attività come l'editing di discorsi e la creazione di contenuti audio.

VALL-E può essere pericoloso
Sebbene il potenziale per intelligenza artificiale può variare, molte persone sono preoccupate per l'impatto negativo che VALL-E potrebbe portare alla luce. VALL-E comporta il rischio di abusi che potrebbero criminalizzare i suoi utenti, ad esempio se la tecnologia viene utilizzata per falsificare l'identificazione vocale o impersonare determinati oratori.
Ad esempio, questa IA è stata utilizzata per simulare la voce di una persona famosa che diceva qualcosa che non aveva mai detto. Questo tipo di caso è stato trovato nei deepfake in formato video.
Inoltre, è quasi simile a Obiettivo AI, che è stato recentemente considerato una violazione dell'etica dell'arte perché si teme che possa sostituire gli artisti umani creando arte digitale.
I produttori musicali lo usano per copiare le voci dei cantanti
VALL-E solleva anche questioni etiche, come quando L'intelligenza artificiale viene utilizzata dalle società di produzione musicale per cantare nuove canzoni senza il consenso del cantante che possiede la voce.
Rendendosi conto delle preoccupazioni e dei possibili rischi che il robot potrebbe comportare, Microsoft, in qualità di sviluppatore, pubblica solo le capacità e il funzionamento del modello di intelligenza artificiale senza condividere il codice sorgente.
I ricercatori di VALL-E affermano che cercheranno di costruire un meccanismo di misurazione in grado di prevenire tali rischi, come un metodo in grado di rilevare una clip audio progettata da VALL-E o il suono originale.
Cos'è Microsoft VALL-E?
Il modello Microsoft VALL-E è progettato per comprendere il linguaggio naturale.
Come funziona Microsoft VALL-E?
Per comprendere il linguaggio naturale, Microsoft VALL-E utilizza tecniche di deep learning.
Quali sono le funzionalità di Microsoft VALL-E?
Utilizzando l'input in linguaggio naturale, Microsoft VALL-E può completare immissioni di testo, rispondere a domande e conversare in modo naturale.
Quali sono le applicazioni di Microsoft VALL-E?
Oltre ai chatbot e alle interfacce basate sulla lingua, Microsoft VALL-E può essere utilizzato anche nelle applicazioni del servizio clienti.
Microsoft VALL-E è open source?
T5 e GPT-3 sono altri modelli di linguaggio Microsoft open source. La disponibilità di Microsoft VALL-E potrebbe essere cambiata. Li agisci direttamente o controlli il sito Web ufficiale di Microsoft.
Iscriviti per ricevere gli ultimi aggiornamenti tecnologici!"