Paradoks Anthropic: Menjadi Pemimpin AI Demi Keamanan Global

Anthropic, perusahaan AI senilai hampir US$1 triliun, memperingatkan bahaya AI namun justru memimpin pengembangannya
Strategi perusahaan: masuk lebih dulu ke 'hutan' AI untuk mengendalikan risikonya
Didirikan oleh mantan karyawan OpenAI yang kecewa dengan kepemimpinan Sam Altman
Kontroversi: kemitraan dengan militer AS dan penggunaan Claude untuk identifikasi target perang
Kritik internal: kurangnya pluralisme dan tantangan terhadap keputusan CEO Dario Amodei
Claude Fable 5 dirilis dengan fitur sabotase tersembunyi yang kemudian ditarik kembali

JBNews.id — Anthropic, perusahaan AI yang didirikan pada 2021 oleh mantan karyawan OpenAI, telah menghabiskan lima tahun terakhir memperingatkan dunia tentang bahaya kecerdasan buatan yang bisa memicu kehancuran massal. Namun di saat yang sama, perusahaan itu justru menjadi salah satu kekuatan paling agresif dalam mendorong kemampuan AI ke level tertinggi. Valuasinya kini hampir mencapai US$1 triliun, dan ia memasok model AI canggih ke klien seperti militer AS.

Sekilas, peringatan keras Anthropic bertolak belakang dengan aksinya. Namun di internal perusahaan, banyak pihak tidak melihat kontradiksi. Mereka berpegang pada dua keyakinan inti: pertama, AI adalah teknologi paling transformatif dalam sejarah manusia dan kedatangannya tidak terelakkan. Kedua, dunia akan lebih baik jika Anthropic tetap berada di garis depan perlombaan AI.

“Mereka melihat diri mereka sebagai ‘orang baik’—pengelola teknologi AI yang bertanggung jawab,” kata beberapa mantan karyawan kepada WIRED dengan syarat anonim. Mereka menambahkan bahwa akumulasi kekuasaan—baik dalam bentuk modal, komputasi, bakat riset, atau pengaruh politik—bukanlah tujuan akhir, melainkan harga yang harus dibayar untuk memenuhi misi: memastikan dunia bertransisi dengan aman menuju AI transformatif.

Strategi ‘Masuk Hutan Lebih Dulu’

Helen Toner, direktur eksekutif Georgetown’s Center for Security and Emerging Technology dan mantan anggota dewan OpenAI, menggunakan analogi untuk menjelaskan pandangan dunia Anthropic. Ia membandingkan AI yang kuat dengan hutan yang dipenuhi harta karun ajaib dan monster berbahaya. Semua penduduk desa bergegas masuk, tergiur harta karun. Dalam versinya, Anthropic ingin masuk lebih dalam daripada siapa pun sambil berinvestasi besar-besaran untuk menjinakkan monster—yakni, menangkap manfaat AI sambil mengendalikan risiko bencana.

“Yang membedakan Anthropic adalah mereka berkata, ‘Orang-orang akan masuk ke hutan, jadi kami harus melakukannya lebih dulu.’ Ini adalah strategi yang sangat eksplisit: membangun AI mutakhir agar menjadi pemain serius di meja perundingan yang bisa bicara tentang seperti apa sistem AI seharusnya, risiko apa yang ditimbulkannya, dan mendorong pengamanan yang wajar,” kata Toner.

CEO Anthropic Dario Amodei menguraikan pendekatan ini dengan gamblang dalam percakapan dengan salah satu pendiri yang diposting di halaman karir perusahaan: “Kamu harus menemukan cara untuk benar-benar kompetitif, benar-benar memimpin industri dalam beberapa kasus, namun tetap bisa melakukannya dengan aman. Jika kamu bisa melakukan itu, tarikan gravitasi yang kamu berikan sangat besar.”

Lahir dari Kekecewaan terhadap OpenAI

Anthropic didirikan pada 2021 oleh sekelompok mantan karyawan OpenAI yang membelot setelah kehilangan kepercayaan pada kemampuan kepemimpinan perusahaan, terutama CEO Sam Altman, untuk menghadirkan AI transformatif dengan aman. Sentimen itu masih membentuk perusahaan saat ini. Dua mantan karyawan mengatakan bahwa dalam diskusi internal, eksekutif Anthropic sering menggambarkan Altman dan OpenAI—dan, pada tingkat lebih rendah, Meta dan xAI milik Elon Musk—sebagai contoh peringatan yang membantu mendefinisikan rasa tanggung jawab Anthropic sendiri.

Dalam banyak hal, Anthropic sama seperti perusahaan Silicon Valley lainnya. Banyak startup memasarkan diri mereka sebagai David yang melawan Goliath industri yang sudah mapan. Google, Facebook, dan Apple semuanya didirikan di atas prinsip idealis, yang kemudian menjadi keruh atau ditinggalkan sama sekali saat mereka menjadi lebih kaya, lebih besar, dan lebih berpengaruh.

Namun, mantan karyawan mengatakan bahwa Anthropic tidak biasa dalam seberapa kuatnya ia percaya pada misinya, dan seberapa eksplisitnya ia memberi tahu karyawan bahwa kekuatan teknologi dan komersial adalah sarana untuk mencapainya. Salah satu mantan karyawan mengatakan bahwa dalam wawancara kerja, Anthropic menekankan kepada pelamar bahwa perusahaan itu bukan perusahaan tipikal yang dibentuk oleh kekuatan pasar: perusahaan itu diatur oleh struktur manfaat publik yang memungkinkannya untuk memprioritaskan “manfaat jangka panjang bagi kemanusiaan” di atas keuntungan.

“Tidak ada dari kami yang ingin mendirikan perusahaan, kami hanya merasa itu adalah tugas kami,” kata Sam McCandlish, salah satu pendiri dan kepala arsitek Anthropic, dalam percakapan yang sama di halaman karir perusahaan. “Kami harus melakukan hal ini. Inilah cara kami akan membuat segalanya menjadi lebih baik dengan AI.”

Anthropic menolak berkomentar untuk cerita ini.

Masalah ‘Orang Baik’

Anthropic mempromosikan di situs webnya bahwa ia adalah organisasi “kepercayaan tinggi, ego rendah,” tanpa banyak politik internal—karakterisasi yang menurut mantan karyawan sebagian besar akurat. Mereka mengatakan bahwa dibandingkan dengan pemimpin di lab AI lain, karyawan Anthropic umumnya memiliki keyakinan pada Amodei untuk memberi tahu mereka yang sebenarnya tentang kemajuan teknologi perusahaan, interaksinya dengan pejabat pemerintah, dan pandangan tentang geopolitik.

Tapi keragaman pemikiran bisa baik untuk akuntabilitas. Shazeda Ahmed, seorang postdoctoral scholar di UCLA yang telah mempelajari asal-usul ideologis gerakan keamanan AI, mengatakan bahwa organisasi seperti Anthropic cenderung berjuang dengan kurangnya pluralisme. Penelitiannya di bidang ini menemukan bahwa gerakan keamanan AI—yang berakar pada subkultur seperti altruisme efektif, di antara komunitas lain—menderita homogenitas pemikiran, dan cenderung condong ke arah tata kelola mandiri.

“Kamu tidak ditantang atas ide-ide ini ketika kamu mengelilingi dirimu dengan orang lain yang mempercayainya,” kata Ahmed. “Dan ketika metrik kesuksesanmu adalah, ‘Sejauh mana aku bertindak berdasarkan keyakinan ideologis ini?’ mereka tidak benar-benar berpikir, ini bisa salah jika kami bukan orang yang tepat untuk memiliki kekuasaan sebanyak ini—mereka tidak selalu memeriksa titik buta mereka sendiri.”

Salah satu mantan karyawan mengatakan ada budaya debat internal yang hidup di Anthropic, dan kritik dari staf sering memicu tanggapan panjang dari kepemimpinan. Tapi mantan karyawan lain menggambarkan gambaran yang lebih suram, di mana kritik yang lebih jujur tetap terbatas pada grup chat pribadi dan jarang berkembang menjadi tantangan langsung terhadap keputusan Amodei. Mereka menggambarkan pertemuan semua karyawan reguler dengan Amodei, yang mereka sebut Dario Vision Quests, seperti “pergi ke khotbah untuk mendengar pendeta.”

Salah satu kontroversi internal terbesar di Anthropic terjadi pada musim gugur 2024, ketika ia menjadi lab AI pertama yang bermitra dengan Palantir untuk menyediakan layanan AI kepada badan intelijen dan pertahanan AS. Beberapa mantan karyawan mengatakan bahwa pertanyaan tentang kesepakatan itu diajukan secara internal, tapi perdebatan itu tidak menghasilkan perubahan pada kebijakan perusahaan. Dalam sebuah posting di forum online LessWrong saat itu, karyawan Anthropic Evan Hubinger menulis bahwa perusahaan itu “sangat terus terang” tentang kesepakatan Palantir dengan staf, dan meskipun mungkin ada beberapa garis yang tidak boleh dilewati tanpa pertimbangan hati-hati, secara keseluruhan itu adalah perkembangan positif.

“Jika kamu mengambil risiko bencana dari AI dengan serius, pemerintah AS adalah aktor yang sangat penting untuk diajak bekerja sama, dan mencoba memblokir pemerintah AS dari penggunaan AI bukanlah strategi yang layak,” tulisnya.

Kurang dari dua tahun kemudian, Pentagon dilaporkan mulai menggunakan Claude untuk melakukan hal-hal seperti mengidentifikasi target serangan dalam perang Israel-Iran. Ketika ditanya dalam wawancara baru-baru ini dengan Bloomberg apakah model Anthropic digunakan dalam serangan terhadap sebuah sekolah dasar Iran yang menewaskan lebih dari 120 orang, Amodei mengatakan dia tidak tahu, tapi itu akan menjadi penggunaan teknologi perusahaan yang disetujui selama manusia yang membuat keputusan akhir. Ini adalah contoh nyata bagaimana visi Anthropic untuk AI yang bertanggung jawab mungkin tidak selalu sejalan dengan visi publik yang lebih luas.

Pandangan kuat Anthropic tentang bagaimana Claude harus dan tidak boleh digunakan juga muncul dalam konteks lain. Awal bulan ini, Anthropic merilis model AI mutakhir, Claude Fable 5, dengan pengaman yang tidak ramah yang unik: Jika peneliti mencoba menggunakannya untuk pengembangan AI perbatasan, yang akan melanggar persyaratan layanan perusahaan, Anthropic secara efektif akan menyabotase pekerjaan mereka secara rahasia. Langkah itu segera dikritik oleh para peneliti di seluruh industri AI, dan Anthropic menariknya kembali beberapa hari kemudian, mengatakan akan membuat pengaman itu terlihat. Dalam sebuah pernyataan saat itu, Anthropic mengatakan tidak mendapatkan keseimbangan yang tepat, dan bahwa niatnya adalah untuk menggagalkan musuh asing AS.

Baca Juga:

Perebutan Kekuasaan

Amodei sendiri secara terbuka mengakui bahaya membiarkan terlalu banyak kekuasaan atas AI terkonsentrasi di tangan beberapa lab, termasuk miliknya sendiri. “Agak canggung untuk mengatakan ini sebagai CEO perusahaan AI, tapi saya pikir tingkat risiko berikutnya sebenarnya adalah perusahaan AI itu sendiri,” tulisnya dalam sebuah esai awal tahun ini. Tapi solusi yang dia sarankan—bahwa perusahaan AI “diawasi dengan hati-hati” dan mungkin membuat komitmen publik untuk “tidak mengambil tindakan tertentu”—akan melakukan sedikit untuk mendistribusikan kembali kekuasaan itu secara fundamental.

Di bagian esai yang lebih panjang, Amodei merenungkan besarnya pengaruhnya sendiri dan tanggung jawab yang menyertainya. Tapi dia sebagian besar menghindari membingkai hal-hal itu dalam istilah pribadi, sebaliknya memposisikannya sebagai masalah spesies: “Kemanusiaan akan segera diberikan kekuatan yang hampir tak terbayangkan, dan sangat tidak jelas apakah sistem sosial, politik, dan teknologi kita memiliki kematangan untuk menggunakannya,” tulisnya. Dia melanjutkan dengan mengatakan bahwa itu adalah tanggung jawab “mereka yang paling dekat dengan teknologi untuk mengatakan yang sebenarnya tentang situasi yang dihadapi umat manusia, yang selalu saya coba lakukan.”

Kritik umum terhadap posisi Anthropic adalah bahwa perusahaan itu menganggap dirinya tahu “kebenaran tentang situasi yang dihadapi umat manusia” lebih baik daripada yang lain. Ia melihat AI sebagai sesuatu yang sangat kuat namun pada akhirnya dapat diatur, asalkan orang yang tepat memimpin pengembangannya. Tapi kenyataannya adalah tidak ada yang tahu persis bagaimana AI akan mengubah dunia—beberapa orang hanya mendapatkan lebih banyak suara dalam hal itu daripada yang lain.

Bagi pembaca di Indonesia, dinamika ini penting untuk dicermati. Persaingan global AI tidak hanya soal teknologi, tapi juga soal tata kelola dan etika. Anthropic Ekspansi ke berbagai negara menunjukkan bagaimana perusahaan ini berusaha memperluas pengaruhnya. Sementara itu, Anthropic vs White House menggambarkan ketegangan antara inovasi dan regulasi. Belum lagi Gugatan Class Action yang dihadapi perusahaan terkait paket langganan AI.

Implikasinya jelas: di tengah perlombaan AI yang semakin cepat, pertanyaan tentang siapa yang mengendalikan teknologi ini dan untuk kepentingan siapa menjadi semakin mendesak. Anthropic, dengan paradoksnya, adalah cerminan dari dilema yang lebih besar yang dihadapi umat manusia.

Paradoks Anthropic: Menjadi Pemimpin AI Demi Keamanan Global

Strategi ‘Masuk Hutan Lebih Dulu’

Lahir dari Kekecewaan terhadap OpenAI

Masalah ‘Orang Baik’

Perebutan Kekuasaan

Berita Terkait

Amazon Hentikan Film OpenAI, Google Investasi Rp1,2 Triliun di A24

Apple Naikkan Harga MacBook dan iPad hingga 20 Persen

YouTube Tambah Fitur Mirip TikTok di Shorts

Mode Gaming Lipat Android 17 Siap Hadir