Vari creatori di contenuti, inclusi autori, cantautori e media come The New York Times, stanno intraprendendo un'azione legale, sostenendo che l'intelligenza artificiale generativa, addestrata su contenuti protetti da copyright, produce copie identiche senza autorizzazione.
Prima ChatGPT è stato presentato, copy-leaks, una società di analisi testuale basata sull'intelligenza artificiale, offriva già da tempo servizi di rilevamento del plagio ad aziende e istituti scolastici.
Quando ChatGPT è stato lanciato per la prima volta, utilizzava il modello GPT-3.5, ma OpenAI è ora passato al più avanzato e potente GPT-4.0 per le sue operazioni.
Il plagio può manifestarsi in vari modi oltre al semplice copiare e incollare direttamente intere frasi e paragrafi.
- Copyleaks mira a trasformare il giudizio soggettivo sull'individuazione del plagio in un processo preciso e scientifico.
- L'azienda utilizza un sistema di punteggio unico che combina misure di testo identico, modifiche minori, contenuto parafrasato e altri elementi per generare un "punteggio di somiglianza" per ciascun contenuto.
- Secondo il rapporto, per GPT-3.5, circa il 45.7% degli output presentava testo identico, il 27.4% includeva piccole modifiche e il 46.5% conteneva contenuti parafrasati.
- Secondo il rapporto, un punteggio dello 0% indica che tutto il contenuto è originale, mentre un punteggio del 100% indica che nessuno dei contenuti è originale.
Copyleaks ha richiesto circa mille output da GPT-3.5, ciascuno composto da circa 400 parole, che coprono 26 argomenti diversi.
Tra i risultati GPT-3.5 analizzati, quello con il punteggio di somiglianza più alto è stato quello dell'informatica (100%), seguito da vicino dalla fisica (92%) e dalla psicologia (88%).
Le materie con i punteggi di somiglianza più bassi erano teatro (0.9%), discipline umanistiche (2.8%) e lingua inglese (5.4%).
"I nostri modelli sono stati creati e addestrati per comprendere concetti utili nella risoluzione dei problemi. Abbiamo implementato misure di sicurezza per impedire la memorizzazione involontaria e i nostri termini di servizio vietano l'uso deliberato dei nostri modelli per riprodurre contenuti."
Portavoce di OpenAI Lindsey Held dichiarato in una comunicazione ad Axios,
Nella causa intentata dal New York Times contro Microsoft e OpenAI si sostiene che la riproduzione estesa dei contenuti da parte dei sistemi di intelligenza artificiale costituisce una violazione del diritto d'autore.
In risposta alla querela, OpenAI ha contestato quel "rigurgito" è un problema raro e ha accusato il New York Times di manipolare i suggerimenti.