AI yang Belum Dirilis dari Anthropic Mengungkap Bug Linux dan OpenBSD yang Terlewatkan Manusia selama Puluhan Tahun – Berita Bitcoin

Poin Utama:

  • Pratinjau Mythos Claude dari Anthropic mendapatkan skor 83,1% di Cybergym, menemukan ribuan zero-day di setiap OS dan browser utama.
  • Project Glasswing diluncurkan pada 7 April 2026, dengan 11 mitra pendiri dan hingga $100 juta kredit penggunaan Mythos untuk pembela.
  • Kerentanan OpenBSD berusia 27 tahun dan bug FFmpeg berusia 16 tahun bertahan dari jutaan pengujian otomatis sampai Mythos menemukannya dalam beberapa jam.

AI Claude Mythos Mencapai Skor 83% di Cybergym dan Menemukan Kerentanan Penting di Setiap Browser dan OS Utama

Model ini, yang oleh Anthropic digambarkan sebagai peningkatan kapabilitas model tunggal terbesar dalam sejarah AI frontier, menyelesaikan pelatihan dan diumumkan secara publik pada 7 April 2026, setelah detail internal muncul pada akhir Maret melalui sistem manajemen konten yang salah konfigurasi yang mengekspos sekitar 3.000 file internal.

Anthropic tidak merilis Pratinjau Claude Mythos kepada publik atau melalui API umum. Perusahaan membatasi akses ke kelompok mitra yang telah diverifikasi setelah model menunjukkan kemampuannya untuk menemukan dan mengeksploitasi kerentanan perangkat lunak yang tidak diketahui sebelumnya dengan kecepatan dan skala yang melampaui para ahli manusia dan sistem AI sebelumnya.

Pada tolok ukur keamanan siber, jarak antara Mythos dan Claude Opus 4.6 sulit diabaikan. Mythos mendapatkan skor 83,1% di Cybergym dibandingkan 66,6% untuk Opus 4.6, dan 93,9% versus 80,8% di SWE-bench Verified. Di SWE-bench Pro, model ini mencatat 77,8% melawan 53,4% — selisih 24 poin. Di Humanity’s Last Exam tanpa alat, mencapai 56,8% dibandingkan 40,0% untuk pendahulunya.

Model ini tidak memerlukan pelatihan khusus keamanan siber untuk menemukan bug ini. Keuntungannya berasal dari kemajuan yang lebih luas dalam penalaran, perencanaan multi-langkah, dan perilaku agen otonom. Dengan basis kode target dalam wadah terisolasi, ia membaca kode sumber, membentuk hipotesis tentang kerentanan keamanan memori, mengompilasi dan menjalankan perangkat lunak, menggunakan debugger seperti Address Sanitizer, mengurutkan file berdasarkan kemungkinan kerentanan, dan menghasilkan laporan bug yang tervalidasi dengan bukti konsep yang berfungsi.

Beberapa eksploitasi tersebut membutuhkan hampir tidak ada arahan manusia. Tomshardware.com melaporkan bahwa kerentanan TCP SACK OpenBSD berusia 27 tahun, overflow integer halus yang memungkinkan penyerang secara jarak jauh merusak host yang merespons dengan membuat paket berbahaya, ditemukan secara otomatis setelah sekitar 1.000 kali pengujian dengan biaya total di bawah $20.000. Bug FFmpeg H.264 berusia 16 tahun bertahan lebih dari lima juta pengujian otomatis dan beberapa audit sebelum Mythos menemukannya.

Hasil browser menarik perhatian khusus. Pada pengujian mesin JavaScript Firefox 147, Mythos menghasilkan 181 eksploit shell lengkap dan 29 kasus kontrol register. Claude Opus 4.6 menghasilkan dua eksploit shell dari set pengujian yang sama. Model ini juga membangun rantai eskalasi hak istimewa kernel Linux yang berfungsi, dari pengguna ke root di server, setelah menyaring 100 CVE terbaru menjadi 40 kandidat yang dapat dieksploitasi dan berhasil mengeksploitasi lebih dari setengahnya.

Validator manusia meninjau 198 laporan kerentanan dari model dan menyetujui tingkat keparahannya 89% dari waktu, dengan 98% kesepakatan dalam satu tingkat keparahan.

Project Glasswing

Kurang dari 1% dari bug yang diidentifikasi telah sepenuhnya diperbaiki sejauh ini. Anthropic mengoordinasikan pengungkapan yang bertanggung jawab, menerbitkan komitmen kriptografi SHA-3 untuk masalah yang belum diperbaiki, dan mengikuti garis waktu 90 plus 45 hari sebelum merilis detail lengkap. Bug eksekusi kode jarak jauh server NFS FreeBSD CVE-2026-4747, berusia 17 tahun, yang memberikan akses root tanpa otentikasi penuh, termasuk dalam contoh yang sudah diungkapkan.

Project Glasswing, yang diumumkan bersamaan dengan model, adalah upaya Anthropic untuk mengarahkan kapabilitas ini ke pertahanan sebelum alat serupa menjadi tersedia secara luas. Mitra pendiri termasuk Amazon Web Services, Apple, Broadcom, Cisco, Crowdstrike, Google, JPMorganChase, Linux Foundation, Microsoft, Nvidia, dan Palo Alto Networks. Akses sedang diperluas ke lebih dari 40 organisasi perangkat lunak penting lainnya.

Anthropic berkomitmen $4 juta dalam sumbangan keamanan sumber terbuka: $2,5 juta ke Alpha-Omega melalui OpenSSF via Linux Foundation, dan $1,5 juta ke Apache Software Foundation.

Perusahaan mengakui bahwa alat AI seperti Mythos menurunkan hambatan untuk menemukan dan mengeksploitasi kerentanan, dan menandai risiko jangka pendek dari aktor negara, China, Iran, Korea Utara, dan Rusia, serta kelompok kriminal jika kapabilitas serupa menyebar tanpa kontrol. Mereka menggambarkan periode kekacauan transisi sebelum para pembela sepenuhnya mengintegrasikan teknologi ini.

Anthropic mengatakan rilis Claude Opus yang akan datang akan menyertakan perlindungan untuk mendeteksi dan memblokir output keamanan siber yang berbahaya, dan berencana memperkenalkan Program Verifikasi Siber untuk profesional keamanan yang telah diverifikasi. Laporan publik tentang temuan mitra dan kerentanan yang telah diperbaiki diharapkan dalam 90 hari.

BTC0,45%
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan