Hacker Hypnotize AI Browser via BioShock Hack

Penulis:Hamzah Nurhamzah
Terbit:
⏱️3 menit membaca
Bagikan:
Tangan seorang pria mengoperasikan keyboard dalam gelap, menggambarkan serangan siber terhadap peramban AI.
  • Peretas berhasil membajak peramban AI seperti ChatGPT Atlas, Comet, dan plugin Claude melalui teknik BioShocking
  • Teknik ini membuat AI percaya konteksnya adalah fantasi sehingga aturan keamanan tidak berlaku
  • AI dapat diperintahkan mengubah password, menginstal malware, dan mencuri data pengguna
  • Serangan terjadi melalui prompt injection di halaman web yang tampak tidak berbahaya
  • Kerentanan ini mengancam integrasi agen AI otonom dalam peramban internet

JBNews.id — Peretas kini dapat membajak peramban kecerdasan buatan (AI) dengan teknik manipulasi konteks yang disebut “BioShocking,” yang membuat AI percaya bahwa aturan keamanan tidak berlaku sehingga dapat mengeksekusi perintah berbahaya atas nama pengguna.

Temuan ini diungkap dalam riset terbaru dari perusahaan keamanan siber LayerX. Teknik tersebut berhasil mengelabui sejumlah peramban AI terkemuka, termasuk ChatGPT Atlas milik OpenAI, Comet milik Perplexity AI, dan plugin Claude milik Anthropic untuk Google Chrome.

Dalam demonstrasi yang dilakukan para peneliti, AI yang telah “dihypnotize” dapat diperintahkan untuk mengubah kata sandi pengguna, menginstal malware, hingga mencuri informasi pribadi. Semua itu terjadi tanpa sepengetahuan pemilik perangkat, kecuali mereka benar-benar memperhatikan layar.

Mekanisme Serangan BioShocking

Istilah “BioShocking” sendiri diambil dari gim video BioShock, di mana karakter utama dapat dikendalikan melawan kehendaknya melalui sebuah frasa spesifik. Konsep serupa diterapkan pada peramban AI.

Dalam kondisi normal, AI beroperasi dengan asumsi bahwa konteksnya adalah nyata, sehingga perilakunya harus sesuai dengan batasan keamanan yang telah ditetapkan. Namun, jika AI berhasil ditipu untuk menganggap konteksnya sebagai “fantasi,” maka tidak ada lagi yang menahan AI untuk bertindak di luar kendali.

Cara kerja serangan ini dimulai dengan melibatkan AI dalam semacam permainan. Para peneliti menciptakan halaman bukti konsep berisi teka-teki bertema BioShock, di mana AI diberi hadiah jika memberikan jawaban yang sengaja salah, seperti 2+2 = 5. Proses ini secara fundamental mengajarkan peramban AI bahwa tindakan “salah” adalah sesuatu yang dapat diterima, sehingga melepaskan mereka dari realitas hingga mengucapkan pernyataan paradoks seperti “Kemenangan adalah kekalahan” — sebuah referensi dari novel 1984 karya George Orwell.

Dalam skenario nyata, pengguna yang tidak curiga dapat membuka halaman web yang tampak tidak berbahaya, tetapi telah disisipi prompt berbahaya — dikenal sebagai prompt injection — yang menjebak peramban AI ke dalam permainan jahat tersebut. Begitu AI terperangkap, peretas dapat mengarahkannya ke mana pun, termasuk membuka repositori kode perusahaan di GitHub.

“Dalam skenario serangan nyata, pengalihan itu bisa mengarah ke mana saja dalam sesi peramban pengguna — tab yang terbuka, repositori terautentikasi, alat internal,” tulis para peneliti dalam laporan mereka.

Yang membuat teknik ini berbahaya adalah serangan terjadi secara terbuka di jendela peramban. Pengguna dapat melihat AI mereka mulai mengetikkan kata-kata jahat, tetapi hanya bisa mencegahnya jika mereka benar-benar memperhatikan. Kerentanan yang terpapar tidak dapat disangkal: konteks tempat peramban AI beroperasi dapat dimanipulasi dengan “cuci otak” agar mengira sedang bermain gim.

Riset ini semakin menggarisbawahi bahaya dari mengintegrasikan agen AI otonom ke dalam perangkat lunak yang digunakan untuk menjelajahi internet. Di era ini, peretas tidak lagi hanya mengandalkan tipu daya terhadap pengguna; kini mereka dapat menipu asisten AI yang mudah tertipu tersebut.

Tangan seorang pria mengoperasikan keyboard dalam gelap, menggambarkan serangan siber terhadap peramban AI.

Para peneliti AI terkemuka sebelumnya telah menyatakan kekhawatiran akan terjadinya “momen Chernobyl” — sebuah insiden dengan korban massal, atau lebih buruk lagi, yang dapat membuat dunia berpaling dari AI selamanya. Temuan LayerX ini menunjukkan bahwa kerentanan semacam itu bukan lagi sekadar teori, melainkan ancaman yang sudah teruji secara teknis.

[CONTENT_END]