0

Ribuan Orang Rela Jual Identitas Buat Latih AI, Dibayar Berapa?

Share

Dunia kecerdasan buatan (AI) sedang mengalami revolusi, namun di balik kemajuan pesatnya, tersembunyi sebuah fenomena baru yang kian meresahkan sekaligus menggiurkan: ribuan orang di berbagai belahan dunia kini secara aktif "menjual" identitas dan data pribadi mereka untuk melatih model-model AI. Daya tarik imbalan finansial, yang seringkali dibayarkan dalam dolar, menjadi magnet kuat bagi banyak individu, meskipun risiko besar terkait privasi dan penyalahgunaan data mengintai di balik setiap transaksi.

Fenomena ini bukan lagi sekadar anekdot, melainkan sebuah tren global yang berkembang pesat. Salah satu contoh nyata adalah Jacobus Louw, seorang pria berusia 27 tahun dari Cape Town, Afrika Selatan. Ia merekam serangkaian video yang menampilkan kakinya dan pemandangan sekitarnya saat berjalan di trotoar. Video-video sederhana ini memberinya penghasilan sebesar USD 14 (sekitar Rp 230.000), sebuah jumlah yang signifikan karena setara dengan sekitar 10 kali upah minimum di negaranya dan cukup untuk kebutuhan belanja setengah minggu. Louw menemukan tugas "Navigasi Perkotaan" ini di Kled AI, sebuah aplikasi inovatif yang dirancang untuk membayar kontributor yang bersedia mengunggah data pribadi mereka, mulai dari video hingga foto, demi melatih model kecerdasan buatan. Dalam beberapa minggu saja, Louw berhasil meraup USD 50 (sekitar Rp 800.000) hanya dengan membagikan cuplikan gambar dan video dari kehidupan sehari-harinya.

Ribuan kilometer jauhnya, di Ranchi, India, Sahil Tigga, seorang mahasiswa berusia 22 tahun, juga menemukan cara untuk mendapatkan uang. Secara teratur, ia mengizinkan aplikasi bernama Silencio untuk mengakses mikrofon ponselnya. Silencio adalah platform yang bertugas mengumpulkan data audio lingkungan sekitar untuk pelatihan AI. Sahil merekam berbagai suara, mulai dari hiruk pikuk di dalam restoran hingga kebisingan lalu lintas di persimpangan jalan yang sibat. Ia bahkan melakukan perjalanan khusus ke lokasi-lokasi unik, seperti lobi hotel yang belum terdokumentasi dalam peta Silencio, demi merekam suasana akustik yang otentik. Dengan upaya ini, Sahil berhasil menghasilkan lebih dari USD 100 (setara Rp 1,6 juta) setiap bulan, jumlah yang cukup untuk menutupi seluruh biaya makanannya.

Tidak hanya di negara berkembang, tren ini juga merambah kota-kota besar di Barat. Di Chicago, Amerika Serikat, Ramelio Hill, seorang pekerja berusia 18 tahun, berhasil mengumpulkan beberapa ratus dolar dengan menjual rekaman obrolan telepon pribadinya dengan teman dan keluarga. Ia menggunakan Neon Mobile, sebuah platform pelatihan AI percakapan yang membayar USD 0,50 per menit untuk setiap rekaman percakapan yang disumbangkan. Kisah-kisah ini hanyalah puncak gunung es dari sebuah ekosistem data yang terus tumbuh, di mana identitas digital dan analog manusia menjadi komoditas berharga.

Mengapa AI Begitu Lapar Data?

Model bahasa AI canggih seperti ChatGPT dari OpenAI dan Gemini dari Google memerlukan volume data pembelajaran yang masif dan berkualitas tinggi untuk dapat berfungsi dan terus berkembang. Data ini mencakup teks, gambar, audio, dan video yang digunakan untuk melatih algoritma agar dapat memahami, memproses, dan menghasilkan informasi dengan akurasi yang lebih baik. Namun, model-model ini kini menghadapi krisis pasokan data yang serius. Sumber pelatihan yang paling sering digunakan, seperti C4, RefinedWeb, dan Dolma—yang sebelumnya mencakup seperempat dari kumpulan data berkualitas tertinggi di web—kini mulai membatasi akses bagi perusahaan AI generatif untuk melatih model mereka.

Para peneliti memperkirakan bahwa perusahaan AI akan kehabisan teks segar dan berkualitas tinggi untuk pelatihan pada tahun 2026. Kondisi ini memaksa beberapa laboratorium untuk beralih menggunakan data sintetis yang dihasilkan oleh AI mereka sendiri. Namun, proses rekursif semacam itu, di mana AI belajar dari data yang juga dihasilkan oleh AI, dapat memiliki konsekuensi fatal. Hal ini berpotensi menyebabkan model AI menghasilkan "halusinasi" atau kesalahan fatal karena tidak lagi memiliki pijakan yang kuat pada data manusia yang otentik dan beragam. Inilah mengapa data manusia menjadi sangat krusial dan dicari.

Di sinilah aplikasi dan platform seperti Kled AI, Silencio, dan Neon Mobile memainkan peran vital. Mereka mengisi celah pasar dengan menghubungkan kebutuhan data AI dengan individu-individu yang bersedia memonetisasi identitas digital dan kehidupan sehari-hari mereka. Di pasar data yang sedang berkembang ini, jutaan orang berpartisipasi dalam apa yang disebut "Gig AI" atau pekerjaan paruh waktu berbasis AI, dengan imbalan finansial yang bervariasi.

Selain platform yang telah disebutkan, ada banyak pilihan lain bagi "pelatih AI":

  • Luel AI, yang didukung oleh inkubator startup ternama Y-Combinator, menyediakan percakapan multibahasa dan membayar sekitar USD 0,15 per menit.
  • ElevenLabs menawarkan kesempatan kepada penjual data untuk mengkloning suara mereka secara digital, memungkinkan siapa pun menggunakan replika suara tersebut dengan biaya dasar USD 0,02 per menit.

Bouke Klein Teeselink, seorang profesor ekonomi di King’s College London, mengamati bahwa "Pelatihan Gig AI adalah kategori pekerjaan baru yang sedang berkembang, dan akan berkembang secara substansial." Ia menjelaskan bahwa perusahaan AI menyadari bahwa membayar orang untuk melisensikan data mereka membantu menghindari risiko sengketa hak cipta yang mungkin timbul jika mereka sepenuhnya bergantung pada konten yang diambil secara sepihak dari web. Lebih lanjut, Veniamin Veselovsky, seorang peneliti AI, menambahkan bahwa perusahaan-perusahaan ini juga sangat membutuhkan data berkualitas tinggi untuk memodelkan perilaku baru yang lebih baik dalam sistem mereka. "Data manusia, untuk saat ini, adalah standar terbaik untuk mengambil sampel dari luar distribusi model," tegas Veselovsky. Dengan kata lain, sentuhan manusia pada data tetap menjadi "emas" bagi perkembangan AI yang akurat dan relevan.

Sisi Gelap: Penyesalan dan Risiko yang Mengintai

Meskipun iming-iming uang dolar terlihat menggiurkan, fenomena penjualan identitas untuk pelatihan AI tidak luput dari sisi gelapnya. Bahkan ketika "pelatih AI" berhasil menegosiasikan perlindungan yang lebih beragam mengenai bagaimana data mereka akan digunakan, perasaan menyesal dan kekhawatiran akan penyalahgunaan data tetap membayangi.

Adam Coy, seorang aktor dari New York, mengalami langsung risiko ini. Pada tahun 2024, ia menjual kemiripan wajah dan suaranya seharga USD 1.000 (sekitar Rp 16 juta) kepada Captions, sebuah editor video bertenaga AI yang kini dikenal sebagai Mirage. Dalam perjanjiannya, Coy telah memastikan bahwa identitasnya tidak akan digunakan untuk tujuan politik, penjualan alkohol, tembakau, atau pornografi, dan lisensinya akan kedaluwarsa dalam satu tahun.

Namun, tidak lama kemudian, teman-teman Adam mulai meneruskan video yang mereka temukan secara daring, menampilkan wajah dan suaranya, yang telah ditonton jutaan kali. Dalam salah satu video di Instagram, replika AI Adam secara mengejutkan mengaku sebagai "dokter vagina" dan mempromosikan suplemen medis yang belum terbukti keamanannya untuk wanita hamil dan pasca-melahirkan.

"Rasanya memalukan untuk menjelaskannya kepada orang-orang," aku Coy. "Komentarnya aneh dibaca karena mengomentari penampilan fisik saya, tapi sebenarnya bukan saya." Coy merasa kecewa dan terkejut dengan penyalahgunaan identitasnya. Ia menjelaskan motivasi awalnya, "Perasaan saya (saat memutuskan untuk menjual barang serupa) adalah bahwa sebagian besar model akan mencari data dan barang serupa di internet, jadi sebaiknya mereka dibayar untuk itu." Namun, pengalaman pahit ini membuatnya kapok. Coy mengatakan bahwa sejak kejadian itu, ia belum mendaftar untuk pekerjaan gig AI lainnya. Ia hanya akan mempertimbangkannya kembali jika ada perusahaan yang menawarkan kompensasi yang sangat besar dan jaminan perlindungan yang jauh lebih kuat.

Kasus Adam Coy menyoroti celah besar dalam perjanjian dan kontrol penggunaan data. Meskipun ada klausul perlindungan, implementasi dan pengawasan di dunia digital yang serba cepat seringkali sulit. Risiko deepfake, pencurian identitas, atau penggunaan data untuk tujuan yang tidak etis atau berbahaya menjadi ancaman nyata. Data yang dijual, seperti rekaman suara atau video wajah, dapat digunakan untuk menciptakan konten yang memfitnah, menyesatkan, atau bahkan melanggar hukum, tanpa persetujuan atau sepengetahuan pemilik identitas asli. Isu privasi jangka panjang, siapa yang benar-benar memiliki data setelah dijual, dan bagaimana data tersebut disimpan serta dilindungi dari peretasan, juga menjadi pertanyaan besar yang belum terjawab sepenuhnya.

Captions, perusahaan yang terlibat dalam kasus Adam Coy, tidak menanggapi permintaan komentar terkait insiden ini, menunjukkan kurangnya transparansi dan akuntabilitas di sektor yang sedang berkembang pesat ini.

Fenomena "jual identitas" untuk AI ini menggambarkan dilema modern antara kebutuhan ekonomi dan pelestarian privasi pribadi. Bagi banyak orang di negara berkembang atau mereka yang membutuhkan penghasilan tambahan, imbalan finansial yang ditawarkan oleh platform pelatihan AI bisa menjadi penyelamat. Namun, harga yang harus dibayar mungkin jauh lebih mahal daripada beberapa dolar yang diterima, yakni kehilangan kendali atas identitas digital dan potensi penyalahgunaan yang tak terduga di masa depan. Seiring AI terus berevolusi, diskusi tentang etika, regulasi, dan hak-hak data pribadi menjadi semakin mendesak, demi melindungi individu dari eksploitasi di era digital yang tak terhindarkan.