60% Output GPT-3.5 OpenAI Mengandungi Beberapa Bentuk Plagiarisme

lelaki pada komputer ribanya di sebuah pulau

Pelbagai pencipta kandungan, termasuk pengarang, penulis lagu dan saluran media seperti The New York Times, sedang mengambil tindakan undang-undang, mendakwa bahawa AI generatif, dilatih mengenai kandungan berhak cipta, menghasilkan salinan yang sama tanpa kebenaran.

Sebelum SembangGPT telah diperkenalkan, copyleaks, sebuah syarikat analisis teks kecerdasan buatan, telah pun menawarkan perkhidmatan pengesanan plagiarisme kepada syarikat dan institusi pendidikan untuk beberapa lama.

Apabila ChatGPT mula-mula dilancarkan, ia menggunakan model GPT-3.5, tetapi OpenAI kini telah dinaik taraf kepada GPT-4.0 yang lebih maju dan berkuasa untuk operasinya.

Plagiarisme boleh nyata dalam pelbagai cara selain daripada menyalin dan menampal keseluruhan ayat dan perenggan secara terus.

Copyleaks bertujuan untuk mengubah pertimbangan subjektif untuk mengesan plagiarisme menjadi proses yang tepat dan saintifik.
Syarikat itu menggunakan sistem pemarkahan unik yang menggabungkan ukuran teks yang sama, pengubahsuaian kecil, kandungan yang diparafrasa dan elemen lain untuk menjana "skor persamaan" bagi setiap bahagian kandungan.
Menurut laporan itu, untuk GPT-3.5, kira-kira 45.7% daripada output menampilkan teks yang sama, 27.4% termasuk perubahan kecil, dan 46.5% mengandungi kandungan yang diparafrasa.
Menurut laporan itu, skor 0% menunjukkan bahawa semua kandungan adalah asli, manakala skor 100% menandakan tiada kandungan yang asli.

Copyleaks meminta kira-kira seribu output daripada GPT-3.5, setiap satu terdiri daripada kira-kira 400 perkataan, meliputi 26 subjek berbeza.

Di antara output GPT-3.5 yang dianalisis, yang mempunyai skor persamaan tertinggi adalah dalam sains komputer (100%), dengan fizik (92%) dan psikologi (88%) mengikutinya.

Subjek yang mempunyai markah persamaan yang paling rendah ialah teater (0.9%), kemanusiaan (2.8%), dan bahasa Inggeris (5.4%).

"Model kami dicipta dan dilatih untuk memahami konsep untuk membantu dalam penyelesaian masalah. Kami telah melaksanakan perlindungan untuk menghalang hafalan yang tidak disengajakan, dan syarat perkhidmatan kami melarang penggunaan model kami secara sengaja untuk menghasilkan semula kandungan."
Jurucakap OpenAI Lindsey Dipegang dinyatakan dalam komunikasi kepada Axios,

Dalam kes undang-undang yang difailkan oleh The New York Times terhadap Microsoft dan OpenAI, adalah didakwa bahawa replikasi meluas sistem AI terhadap kandungan berjumlah pelanggaran hak cipta.

Sebagai tindak balas kepada tuntutan mahkamah, OpenAI bertengkar bahawa "regurgitasi" adalah isu yang luar biasa dan menuduh The New York Times memanipulasi gesaan.

Fahad Khan

Pemburu Tawaran untuk Digital Phablet dengan pengalaman Pemasaran Digital selama 8+ tahun.

Seterusnya How to Switch from Gemini to Google Assistant »

sebelum « Elon Musk Sues OpenAI Over Alleged Shift from Original Mission

Komen Disqus Memuatkan...

Kongsi

diterbitkan oleh

Fahad Khan

Tags: Kandungan AISembangGPTKandunganPenciptaan KandunganGPT-3.5OpenAI

Mac 4, 2024 4: 22 pm

60% Output GPT-3.5 OpenAI Mengandungi Beberapa Bentuk Plagiarisme

Post yang berkaitan

Headline