JBNews.id — Praktik kontraktor yang menggunakan chatbot AI untuk menghasilkan data pelatihan bagi model bahasa besar (LLM) semakin meluas, mengancam kualitas dan stabilitas sistem kecerdasan buatan yang tengah dikembangkan perusahaan teknologi global.
Fenomena yang disebut sebagai “kanibalisme AI” ini terungkap setelah New Scientist mewawancarai sejumlah pekerja lepas yang direkrut perusahaan teknologi untuk menghasilkan data pelatihan orisinal. Seorang kontraktor yang diidentifikasi sebagai Alice mengakui bahwa praktik ini sangat umum terjadi di industrinya.
“Ini sangat meluas. Setiap perusahaan tempat saya bekerja memiliki pedoman eksplisit tentang hal ini dan mereka jelas berusaha menangkap pelanggar. Tapi saya rasa mereka tidak bisa menghentikannya,” kata Alice kepada New Scientist.
Praktik ini muncul di tengah perlombaan perusahaan teknologi untuk mengumpulkan data orisinal sebanyak-banyaknya guna melatih LLM. Sebuah studi menemukan bahwa jumlah data yang digunakan untuk melatih AI telah berlipat ganda setiap sembilan bulan sejak 2010 — pertumbuhan eksponensial yang diperkirakan akan segera menemui hambatan karena pasokan data bersih semakin menipis.
Ketika tidak ada lagi konten orisinal yang bisa diambil, perusahaan mulai membayar pekerja untuk menghasilkan data pelatihan baru. Namun, kontrak yang ditawarkan seringkali berkualitas rendah, mencakup tugas-tugas hiper-spesifik seperti menjalankan penggajian mingguan untuk musisi Broadway hingga merekam aktivitas domestik seperti melipat pakaian.
Baca Juga:
Kontraktor AI lainnya mengaku menggunakan LLM untuk menghindari kesalahan yang bisa membuat mereka kehilangan pekerjaan. “Saya sangat takut kehilangan sumber pendapatan, dan setelah itu, segalanya menjadi lebih mudah dengan menggunakan LLM,” jelas seorang kontraktor kepada New Scientist.
“Untuk banyak proyek yang saya kerjakan sekarang, saya membuat skenario. Saya akan menggunakan satu LLM untuk membantu membuat skenario, lalu LLM lain untuk membuat file yang menyertainya. Saya merasa bersalah, tapi pada awalnya ini lebih tentang memastikan saya tidak membuat kesalahan,” tambahnya.
Alice menegaskan bahwa kontraktor yang cermat bisa lolos dari deteksi. “Hanya pengguna paling ceroboh yang tertangkap. Siapa pun dengan kesadaran minimal tentang ciri khas AI bisa menyuruh output mereka untuk tidak menggunakannya, dan pada titik itu apa yang bisa dilakukan perusahaan?” ujarnya.
Ia juga mengkritik praktik perusahaan yang memberikan kontrak berkualitas rendah. “Jika perusahaan ini menginginkan data berkualitas, mereka harus menawarkan kontrak berkualitas. Sebaliknya, mereka merendahkan orang-orang yang kesulitan, mempekerjakan mereka dalam waktu sesingkat mungkin, dan membuang mereka begitu proyek selesai tanpa pemberitahuan,” kata Alice.
Fenomena ini menimbulkan ironi besar bagi perusahaan AI. Setelah mengambil konten milik orang lain tanpa izin untuk menciptakan produk yang mengancam lapangan kerja di seluruh ekonomi, mereka kini menghadapi situasi di mana pekerja yang mereka rekrut justru menggunakan teknologi yang sama untuk melakukan tugas manusia yang tersisa dengan cara semalas mungkin.
Para ahli telah lama memperingatkan bahwa praktik kanibalisme AI dapat mengganggu stabilitas model bahasa besar. Jika data yang digunakan untuk melatih AI generasi berikutnya sudah terkontaminasi oleh output AI lainnya, kualitas dan keandalan sistem bisa menurun drastis — fenomena yang dikenal sebagai knowledge decay.
Dampak dari situasi ini bisa sangat serius bagi industri AI secara keseluruhan. Perusahaan yang mengandalkan data berkualitas untuk mempertahankan keunggulan kompetitif mereka mungkin akan menghadapi tantangan besar jika rantai pasokan data mereka terkontaminasi oleh output AI yang tidak terverifikasi.

Bagi kontraktor yang bekerja dalam tekanan ekonomi, penggunaan AI untuk menghasilkan data pelatihan menjadi pilihan rasional. Mereka menghadapi dilema antara menghasilkan pekerjaan berkualitas dengan upah rendah atau menggunakan jalan pintas yang berisiko namun lebih efisien secara waktu.
“Saya sangat takut kehilangan sumber pendapatan, dan setelah itu, segalanya menjadi lebih mudah dengan menggunakan LLM,” kata seorang kontraktor, menggambarkan tekanan yang mendorong praktik ini.
Alice menambahkan bahwa perusahaan seharusnya tidak terkejut dengan situasi ini. “Jika mereka menginginkan data berkualitas, mereka harus membayar dengan layak,” tegasnya.
Fenomena ini juga memunculkan pertanyaan tentang efektivitas sistem deteksi yang digunakan perusahaan untuk memfilter data palsu. Meskipun perusahaan memiliki pedoman eksplisit dan berusaha menangkap pelanggar, Alice menyatakan bahwa sistem tersebut tidak cukup canggih untuk mendeteksi data yang dihasilkan AI setelah melalui proses penyuntingan minimal.
Para pengamat industri menilai bahwa situasi ini mencerminkan masalah struktural dalam ekosistem ekonomi gig yang diciptakan oleh perusahaan teknologi. Model bisnis yang mengandalkan pekerja lepas dengan kontrak jangka pendek dan upah rendah menciptakan insentif yang salah bagi kualitas data.
Dalam jangka panjang, praktik kanibalisme AI ini bisa memperlambat laju pengembangan AI itu sendiri. Jika data pelatihan yang terkontaminasi menghasilkan model yang kurang akurat dan tidak dapat diandalkan, kepercayaan terhadap teknologi AI secara keseluruhan bisa tergerus.
Bagi perusahaan teknologi yang berinvestasi miliaran dolar dalam pengembangan AI, temuan ini menjadi peringatan serius. Mereka harus mengevaluasi kembali strategi pengadaan data dan memastikan bahwa kontraktor yang mereka rekrut memiliki insentif yang tepat untuk menghasilkan data berkualitas tinggi.
Tanpa perubahan signifikan dalam cara perusahaan memperlakukan pekerja data mereka, praktik kanibalisme AI diperkirakan akan terus berlanjut dan bahkan semakin meluas, mengancam fondasi industri yang sedang dibangun dengan biaya sangat besar.




