60 % des résultats GPT-3.5 d'OpenAI contenaient une certaine forme de plagiat

homme sur son ordinateur portable sur une île

Divers créateurs de contenu, notamment des auteurs, des auteurs-compositeurs et des médias comme The , intentent une action en justice, affirmant que l'IA générative, formée sur du contenu protégé par le droit d'auteur, produit des copies identiques sans autorisation.

Avant ChatGPT a été présenté, Copyleaks, une société d’analyse de textes basée sur l’intelligence artificielle, proposait déjà depuis un certain temps des services de détection de plagiat aux entreprises et aux établissements d’enseignement.

Lors de son lancement initial, ChatGPT utilisait le modèle GPT-3.5, mais OpenAI est désormais passé au GPT-4.0, plus avancé et plus puissant, pour ses opérations.

Le plagiat peut se manifester de diverses manières, au-delà du simple copier-coller direct de phrases et de paragraphes entiers.

Copyleaks vise à transformer le jugement subjectif de détection du plagiat en un processus précis et scientifique.
La société utilise un système de notation unique qui combine des mesures de texte identique, de modifications mineures, de contenu paraphrasé et d'autres éléments pour générer un « score de similarité » pour chaque élément de contenu.
Selon le rapport, pour GPT-3.5, environ 45.7 % des résultats comportaient un texte identique, 27.4 % incluaient des modifications mineures et 46.5 % contenaient du contenu paraphrasé.
Selon le rapport, un score de 0 % indique que tout le contenu est original, tandis qu'un score de 100 % signifie qu'aucun contenu n'est original.

Copyleaks a demandé environ un millier de résultats à GPT-3.5, chacun composé d'environ 400 mots, couvrant 26 sujets différents.

Parmi les résultats GPT-3.5 analysés, celui présentant le score de similarité le plus élevé était celui de l'informatique (100 %), suivi de près par la physique (92 %) et la psychologie (88 %).

Les matières avec les scores de similarité les plus faibles étaient le théâtre (0.9 %), les sciences humaines (2.8 %) et la langue anglaise (5.4 %).

"Nos modèles ont été créés et formés pour comprendre les concepts afin de faciliter la résolution de problèmes. Nous avons mis en place des mesures de protection pour empêcher toute mémorisation involontaire, et nos conditions d'utilisation interdisent l'utilisation délibérée de nos modèles pour reproduire du contenu."
Porte-parole d'OpenAI Lindsey tenue déclaré dans une communication à Axios,

Dans le procès intenté par le New York Times contre Microsoft et OpenAI, il est allégué que la réplication extensive du contenu des systèmes d'IA équivaut à une violation du droit d'auteur.

En réponse au procès, OpenAI a soutenu que la « régurgitation » est un problème rare et a accusé le New York Times de manipuler les invites.

Fahd Khan

Un chasseur de bonnes affaires pour une phablette numérique avec plus de 8 ans d'expérience en marketing numérique.

Suivant How to Switch from Gemini to Google Assistant »

Précédent « Elon Musk Sues OpenAI Over Alleged Shift from Original Mission

Commentaires Disqus Chargement ...

Publié par

Fahd Khan

Mots clés: Contenu IAChatGPTContenuCréation de contenuGPT-3.5OpenAI

4 mars 2024

60 % des résultats GPT-3.5 d'OpenAI contenaient une certaine forme de plagiat

Article similaire

Headline