Claude Mythos Anthropic nampak menakutkan kuat untuk keselamatan siber, tetapi model AI yang lebih murah mungkin sudah cukup baik

Model Claude Mythos baharu Anthropic masuk dengan tenaga bos besar, dengan dakwaan bahawa ia boleh membantu mendedahkan kerentanan serius merentasi pelayar utama dan sistem pengendalian. Ia juga berada di tengah Project Glasswing, program di mana Anthropic bekerjasama dengan syarikat teknologi besar untuk membetulkan isu sebelum model itu mendapat pendedahan yang lebih luas.

Kedengaran luar biasa, tetapi penyelidikan terbaharu mengatakan ceritanya tidak semudah "Mythos mengatasi semua orang."

Makalah dari Aisle berhujah bahawa walaupun Mythos mungkin merupakan salah satu model AI terkuat secara keseluruhan untuk kerja keselamatan siber, ia tidak jauh ke hadapan berbanding yang lain. Dalam sesetengah kes, model yang lebih murah dan lebih mudah diakses sudah boleh melakukan banyak perkara yang sama.

Ini termasuk pilihan yang terbuka atau lebih berpatutan seperti GPT-OSS-120B, Qwen3 32B, dan Kimi K2, yang menurut Aisle juga mampu mengesan beberapa kelemahan utama yang dikaitkan dengan Mythos. Perkara utama dari makalah ini agak mudah: keselamatan siber bukan satu tugas tunggal.

Mencari pepijat, mengesahkannya, mengetahui bagaimana ia boleh dieksploitasi, dan kemudian membantu menampalnya adalah peringkat yang berbeza-beza. Model yang hebat di satu bahagian tidak semestinya terbaik dalam segala-galanya. Pandangan Aisle adalah bahawa faktor-faktor seperti kos per token, kelajuan, dan cara keseluruhan aliran kerja keselamatan disediakan sama pentingnya dengan kecerdasan model mentah.

Bagi pasukan di Malaysia dan rantau SEA yang lebih luas, itu sangat penting. Kebanyakan syarikat di sini, sama ada studio permainan, platform esports, pembangun aplikasi, atau pasukan teknologi perusahaan, tidak mempunyai bajet tanpa had untuk menggunakan stack AI paling premium. Jika model yang lebih ringan boleh memberikan sebahagian besar nilai dengan harga yang lebih rendah, itu adalah laluan yang jauh lebih realistik bagi syarikat tempatan yang cuba meningkatkan keselamatan tanpa membakar wang.

Namun begitu, ada sisi lain kepada ini. Penyelidikan dari Institut Keselamatan AI UK (AISI) dilaporkan mendapati bahawa Mythos memang unggul pada penanda aras keselamatan siber yang lebih sukar, terutamanya dalam penemuan kerentanan yang lebih kompleks dan tugas eksploitasi. Sebahagian daripada kelebihan itu berasal daripada kemampuannya mengendalikan tetingkap konteks yang sangat besar, dengan ujian sehingga 100 juta token. Pandangan AISI adalah bahawa Mythos mungkin akan bertambah baik lagi jika diberikan lebih banyak pengiraan inferens.

Jadi ya, Mythos mungkin benar-benar elit. Masalahnya ialah elit biasanya bermakna mahal.

Anthropic belum menerbitkan harga Mythos, tetapi laporan Tom's Hardware menyebut bahawa model kedua terbaik dalam ujian AISI adalah Claude Opus 4.6, yang sudah dianggap salah satu penawaran Anthropic yang lebih mahal. Jika Mythos akhirnya berharga lebih mahal, syarikat-syarikat perlu bertanya soalan yang sangat praktikal: adakah peningkatan prestasi akhir berbaloi dengan bil?

Soalan itu menjadi lebih penting apabila uptime masuk dalam perbincangan. Menurut laporan itu, model Anthropic mempunyai uptime 98.4% dalam 90 hari terakhir pada masa penulisan. Dalam penggunaan pengguna biasa, itu mungkin tidak kedengaran bencana. Dalam keselamatan siber perusahaan, itu tidak bagus. Penanda aras yang biasanya dikehendaki oleh pembeli awan yang serius adalah uptime 99.99%.

Kenapa pembaca biasa harus mengambil berat? Mudah sahaja. Alat keselamatan AI yang lebih baik boleh membantu syarikat menampal kerentanan dengan lebih cepat dalam produk yang orang gunakan setiap hari, dari pelancaran permainan dan sistem pembayaran hinggalah platform komuniti dan perkhidmatan awan. Tetapi jika model yang paling kuat terlalu mahal atau tidak tersedia secara konsisten, banyak pasukan mungkin memilih alat yang lebih murah yang "cukup baik" sebagai gantinya.

Itulah mengapa Mythos terasa kurang seperti kemenangan bersih dan lebih seperti tembakan amaran. Anthropic mungkin mempunyai salah satu model keselamatan siber terbaik dalam pasaran sekarang, tetapi pasaran sudah menunjukkan bahawa harga, kebolehpercayaan, dan kesesuaian aliran kerja sama pentingnya dengan kemenangan penanda aras yang gemilang.

Bagi SEA, itulah kemungkinan pengajaran sebenar. Pemenang mungkin bukan model dengan pelancaran paling kuat, tetapi yang benar-benar mampu dibeli, dijalankan secara konsisten, dan digunakan dalam skala besar oleh syarikat di sini.

Sumber: Tom's Hardware

Claude Mythos Anthropic nampak menakutkan kuat untuk keselamatan siber, tetapi model AI yang lebih murah mungkin sudah cukup baik

Tag

Artikel Berkaitan

Percubaan paten monster-catching terbaru Nintendo ditolak di Jepun

Nintendo’s Pictonico! Tukar Foto Kawan Jadi Minigame Chaotic Gaya WarioWare

Valve Lawan Saman Loot Box New York Ketika Ekonomi Skin CS2 Dikritik