Platform Crowdsourced FLARE-AI untuk Lapor Bahaya AI

Penulis:Hamzah Nurhamzah
Terbit:
⏱️4 menit membaca
Bagikan:
Ilustrasi antarmuka platform FLARE-AI untuk melaporkan bahaya sistem kecerdasan buatan
  • FLARE-AI adalah platform crowdsourced untuk melaporkan dan melacak bahaya sistem AI
  • Dikembangkan oleh Avijit Ghosh (HuggingFace), Elaine Zhu, dan Shayne Longpre bersama 49 ahli dari 32 organisasi
  • Sistem open source memungkinkan verifikasi dan penerusan laporan ke pembuat model serta MITRE
  • Konsep mirip Downdetector untuk gangguan layanan, tapi khusus untuk masalah AI
  • Mencakup berbagai masalah: malware, kebocoran data, bahaya psikologis, bias, dan misinformasi
  • RUU kongres AS mendorong NIST untuk mengembangkan standar pelaporan cacat AI
  • Tantangan: mengelola banjir laporan dan memastikan dukungan organisasi kredibel

JBNews.id — Sekelompok peneliti kecerdasan buatan (AI) meluncurkan situs crowdsourced bernama Flaw Reporting for AI (FLARE-AI) yang dirancang untuk melaporkan dan melacak berbagai bahaya yang ditimbulkan oleh sistem AI. Platform ini memungkinkan pengguna untuk membunyikan alarm jika, misalnya, chatbot menghasilkan malware, merembeskan informasi pribadi, atau memicu pemikiran delusional pada pengguna.

FLARE-AI hadir di tengah meningkatnya kekhawatiran tentang dampak negatif AI yang kian meluas. Situs ini menggunakan kode sumber terbuka (open source) yang memungkinkan pihak lain untuk memverifikasi suatu masalah dan meneruskan laporan kepada pembuat model AI, serta organisasi seperti MITRE—sebuah nirlaba yang melacak masalah pada sistem teknis. Konsep ini mirip dengan Downdetector, yang mengumpulkan laporan pengguna secara real-time untuk gangguan layanan global yang memengaruhi aplikasi dan situs web.

“Saat ini, tidak ada cara yang terpusat dan dapat dipertanggungjawabkan untuk melaporkan cacat pada sistem AI,” ujar Avijit Ghosh, seorang peneliti kebijakan AI di HuggingFace yang memimpin pengembangan FLARE-AI bersama ilmuwan komputer Elaine Zhu dan Shayne Longpre. Sistem peringatan ini dikembangkan dengan melibatkan 49 ahli AI dari 32 organisasi berbeda.

Dalam sebuah makalah yang menguraikan pekerjaan mereka, para peneliti berpendapat bahwa inisiatif ini bisa menjadi krusial seiring dengan adopsi AI yang lebih luas dan sistem otonom (agentic systems) yang semakin berkuasa. Mereka percaya bahwa tidak adanya cara yang konsisten untuk melaporkan cacat AI adalah masalah signifikan yang perlu segera diatasi.

Jessica Ji, seorang peneliti di lembaga think tank Center for Security and Emerging Technology, menyambut baik inisiatif ini. “Saya pikir ini adalah inisiatif yang sangat bagus,” katanya. Ji menambahkan bahwa para peneliti benar dalam mencatat bahwa mekanisme pelaporan yang ada saat ini terfragmentasi dan model AI seringkali merupakan kotak hitam (black boxes). “Saya mendukung apa pun yang membuat AI lebih transparan,” tegasnya.

Meskipun bug dan masalah keamanan siber mendapat banyak perhatian—terutama akhir-akhir ini—Ghosh menjelaskan bahwa masalah dengan sistem AI mencakup topik-topik seperti bahaya psikologis, diskriminasi atau bias, dan misinformasi. Ia menambahkan bahwa perusahaan yang berbeda memiliki standar yang berbeda mengenai masalah-masalah tersebut, yang berarti beberapa masalah tidak terdeteksi. “Dengan tidak adanya sistem pengungkapan yang terkoordinasi, tidak ada mekanisme eksternal untuk menegakkan transparansi,” kata Ghosh.

Serangkaian insiden baru-baru ini yang melibatkan alat AI populer menunjukkan betapa mudahnya teknologi ini menjadi berbahaya. Pekan ini, sebuah perusahaan bernama LayerX mengungkapkan cara untuk menipu peramban web yang diperkuat AI, termasuk Atlas milik OpenAI dan Comet milik Perplexity, sehingga menerobos batasan keamanan mereka. Meyakinkan model AI di belakang peramban bahwa ia sedang bermain game, misalnya, dapat menyebabkan peramban tersebut menjadi nakal dan mencoba meretas sebuah situs web. (LayerX menyatakan bahwa perusahaan yang bertanggung jawab atas peramban yang terkena dampak telah memperbaiki masalah tersebut.)

Pada bulan April lalu, Johann Rehberger, seorang peneliti keamanan, menemukan cara untuk menipu Claude agar membocorkan data pribadi menggunakan gambar yang dihasilkan oleh ChatGPT. AI juga memperkenalkan jenis masalah baru yang aneh. Tahun lalu, OpenAI terpaksa memperbarui modelnya setelah menemukan bahwa model tersebut terlalu menjilat (sycophantic), yang terkadang tampaknya mendorong pemikiran delusional.

Rumman Chowdhury, CEO dan pendiri Humane Intelligence PBC, mengatakan bahwa FLARE-AI bisa menjadi cara yang berguna bagi banyak pengembang AI untuk menerapkan metode pelaporan masalah dengan alat mereka. Namun, ia menambahkan bahwa inisiatif semacam itu seringkali menghadapi tantangan serius. Salah satunya adalah mengelola banjir laporan masalah, yang banyak di antaranya mungkin tidak serius. Tantangan lainnya adalah memastikan skema pelaporan didukung oleh organisasi yang kredibel dan berwenang.

Rancangan undang-undang (RUU) kongres bulan lalu bisa memberikan dukungan pemerintah AS di balik upaya seperti FLARE-AI. Undang-undang yang diperkenalkan oleh Perwakilan Deborah Ross, Jeff Hurd, dan Don Beyer ini akan mewajibkan National Institute of Standards and Technology (NIST) untuk mengembangkan standar seputar pelaporan cacat AI dan memelihara basis data pelaporan cacat AI yang terpusat. Ghosh dan rekan-rekannya mengatakan bahwa hal ini akan memberi insentif kepada pengembang AI untuk mengatasi masalah dalam sistem mereka dan memungkinkan pengguna memeriksa keamanan sistem yang berbeda untuk kasus penggunaan yang berbeda.

Kebutuhan akan cara-cara baru untuk melaporkan bahaya AI tampaknya hanya akan terus meningkat. Sistem otonom seperti OpenClaw memiliki potensi lebih besar untuk menimbulkan bahaya, begitu pula model yang lebih mampu menyelidiki dan meretas sistem komputer. Platform seperti FLARE-AI menjadi semakin relevan seiring dengan perkembangan teknologi yang pesat, termasuk pada perangkat audio seperti Soundcore Liberty 5 Pro yang juga mengintegrasikan AI. Keamanan siber menjadi perhatian utama, seperti yang terlihat pada celah peretasan PC melalui perangkat Bluetooth.

Implikasinya bagi publik dan industri teknologi sangat jelas: transparansi dan akuntabilitas dalam pengembangan AI bukan lagi sekadar pilihan, melainkan kebutuhan mendesak. Dengan adanya platform seperti FLARE-AI, diharapkan masyarakat memiliki saluran yang lebih andal untuk menyuarakan kekhawatiran mereka, sementara regulator dan pengembang mendapatkan data yang lebih akurat untuk mengambil tindakan pencegahan.