Divers créateurs de contenu, notamment des auteurs, des auteurs-compositeurs et des médias comme The , intentent une action en justice, affirmant que l'IA générative, formée sur du contenu protégé par le droit d'auteur, produit des copies identiques sans autorisation.
Avant ChatGPT a été présenté, Copyleaks, une société d’analyse de textes basée sur l’intelligence artificielle, proposait déjà depuis un certain temps des services de détection de plagiat aux entreprises et aux établissements d’enseignement.
Lors de son lancement initial, ChatGPT utilisait le modèle GPT-3.5, mais OpenAI est désormais passé au GPT-4.0, plus avancé et plus puissant, pour ses opérations.
Le plagiat peut se manifester de diverses manières, au-delà du simple copier-coller direct de phrases et de paragraphes entiers.
Copyleaks a demandé environ un millier de résultats à GPT-3.5, chacun composé d'environ 400 mots, couvrant 26 sujets différents.
Parmi les résultats GPT-3.5 analysés, celui présentant le score de similarité le plus élevé était celui de l'informatique (100 %), suivi de près par la physique (92 %) et la psychologie (88 %).
Les matières avec les scores de similarité les plus faibles étaient le théâtre (0.9 %), les sciences humaines (2.8 %) et la langue anglaise (5.4 %).
"Nos modèles ont été créés et formés pour comprendre les concepts afin de faciliter la résolution de problèmes. Nous avons mis en place des mesures de protection pour empêcher toute mémorisation involontaire, et nos conditions d'utilisation interdisent l'utilisation délibérée de nos modèles pour reproduire du contenu."
Porte-parole d'OpenAI Lindsey tenue déclaré dans une communication à Axios,
Dans le procès intenté par le New York Times contre Microsoft et OpenAI, il est allégué que la réplication extensive du contenu des systèmes d'IA équivaut à une violation du droit d'auteur.
En réponse au procès, OpenAI a soutenu que la « régurgitation » est un problème rare et a accusé le New York Times de manipuler les invites.