AI

60 % des résultats GPT-3.5 d'OpenAI contenaient une certaine forme de plagiat

Divers créateurs de contenu, notamment des auteurs, des auteurs-compositeurs et des médias comme The , intentent une action en justice, affirmant que l'IA générative, formée sur du contenu protégé par le droit d'auteur, produit des copies identiques sans autorisation.

Avant ChatGPT a été présenté, Copyleaks, une société d’analyse de textes basée sur l’intelligence artificielle, proposait déjà depuis un certain temps des services de détection de plagiat aux entreprises et aux établissements d’enseignement.

Lors de son lancement initial, ChatGPT utilisait le modèle GPT-3.5, mais OpenAI est désormais passé au GPT-4.0, plus avancé et plus puissant, pour ses opérations.

PUBLICITÉ

Le plagiat peut se manifester de diverses manières, au-delà du simple copier-coller direct de phrases et de paragraphes entiers.

  • Copyleaks vise à transformer le jugement subjectif de détection du plagiat en un processus précis et scientifique.
  • La société utilise un système de notation unique qui combine des mesures de texte identique, de modifications mineures, de contenu paraphrasé et d'autres éléments pour générer un « score de similarité » pour chaque élément de contenu.
  • Selon le rapport, pour GPT-3.5, environ 45.7 % des résultats comportaient un texte identique, 27.4 % incluaient des modifications mineures et 46.5 % contenaient du contenu paraphrasé.
  • Selon le rapport, un score de 0 % indique que tout le contenu est original, tandis qu'un score de 100 % signifie qu'aucun contenu n'est original.

Copyleaks a demandé environ un millier de résultats à GPT-3.5, chacun composé d'environ 400 mots, couvrant 26 sujets différents.

Parmi les résultats GPT-3.5 analysés, celui présentant le score de similarité le plus élevé était celui de l'informatique (100 %), suivi de près par la physique (92 %) et la psychologie (88 %).

PUBLICITÉ

Les matières avec les scores de similarité les plus faibles étaient le théâtre (0.9 %), les sciences humaines (2.8 %) et la langue anglaise (5.4 %).

"Nos modèles ont été créés et formés pour comprendre les concepts afin de faciliter la résolution de problèmes. Nous avons mis en place des mesures de protection pour empêcher toute mémorisation involontaire, et nos conditions d'utilisation interdisent l'utilisation délibérée de nos modèles pour reproduire du contenu."

Porte-parole d'OpenAI Lindsey tenue déclaré dans une communication à Axios,

Dans le procès intenté par le New York Times contre Microsoft et OpenAI, il est allégué que la réplication extensive du contenu des systèmes d'IA équivaut à une violation du droit d'auteur.

En réponse au procès, OpenAI a soutenu que la « régurgitation » est un problème rare et a accusé le New York Times de manipuler les invites.

PUBLICITÉ
Fahd Khan

Un chasseur de bonnes affaires pour une phablette numérique avec plus de 8 ans d'expérience en marketing numérique.

Commentaires Disqus Chargement ...
Partager
Publié par
Fahd Khan