Di Dalam Claude Opus 4.7: Model Baru Anthropic Menaikkan Standar Untuk Rekayasa Perangkat Lunak Otonom

Secara Singkat

Anthropic merilis Claude Opus 4.7, meningkatkan rekayasa perangkat lunak, penalaran multimodal, penanganan konteks panjang, dan ketepatan instruksi untuk tugas AI yang kompleks dan berjalan lama di seluruh alur kerja perusahaan.

Inside Claude Opus 4.7: Anthropic’s New Model Raises The Bar For Autonomous Software EngineeringPerusahaan riset dan keselamatan AI Anthropic telah merilis Claude Opus 4.7, model baru yang diposisikan sebagai peningkatan bertahap namun signifikan dari Opus 4.6, dengan penekanan khusus pada peningkatan dalam rekayasa perangkat lunak tingkat lanjut dan pelaksanaan tugas kompleks. Model ini dirancang untuk menangani alur kerja yang berjalan lama dan secara teknis menuntut dengan konsistensi yang lebih baik, kepatuhan instruksi yang lebih tepat, dan validasi internal output yang ditingkatkan sebelum pembuatan respons.

Menurut perusahaan, Opus 4.7 menunjukkan performa yang lebih kuat dalam skenario yang melibatkan tantangan pengkodean rumit, di mana iterasi sebelumnya sering membutuhkan pengawasan manusia yang lebih dekat. Model ini digambarkan sebagai lebih mampu menjaga ketelitian di seluruh rangkaian pemecahan masalah yang panjang, dengan kecenderungan yang lebih kecil untuk mengabaikan atau salah menafsirkan instruksi multi-langkah. Dalam kasus penggunaan praktis, model ini dimaksudkan untuk mendukung pelaksanaan tugas rekayasa yang lebih otonom, termasuk debugging, desain sistem, dan pembuatan kode terstruktur.

Memperkenalkan Kemampuan yang Diperluas dalam Kinerja Multimodal dan Konteks Panjang

Perbaikan utama yang disorot dalam rilis ini adalah kemampuan multimodal yang ditingkatkan dari model, terutama dalam pemahaman visual. Opus 4.7 mampu memproses gambar resolusi lebih tinggi dibandingkan versi sebelumnya, memungkinkan interpretasi yang lebih detail terhadap input visual yang kompleks seperti tangkapan layar padat, diagram teknis, dan antarmuka desain. Peningkatan ini diposisikan sebagai relevan untuk aplikasi yang membutuhkan presisi tingkat piksel, termasuk analisis antarmuka dan alur kerja ekstraksi dokumen.

Anthropic juga mencatat penyempurnaan dalam kualitas output untuk tugas profesional dan kreatif. Model ini dilaporkan mampu menghasilkan presentasi yang lebih terstruktur, dokumentasi yang lebih jelas, dan desain antarmuka yang lebih baik saat digunakan dalam konteks produktivitas. Perubahan ini dipandang sebagai bagian dari upaya yang lebih luas untuk meningkatkan kegunaan di lingkungan perusahaan nyata daripada sekadar peningkatan berbasis tolok ukur.

Sistem ini juga telah diuji dalam domain yang melibatkan penalaran konteks panjang dan retensi memori. Opus 4.7 digambarkan sebagai lebih baik dalam mempertahankan informasi kontekstual berbasis file selama sesi yang diperpanjang, memungkinkannya melanjutkan alur kerja yang kompleks dengan kebutuhan pengulangan input latar belakang yang lebih sedikit. Ini dimaksudkan untuk mendukung pengembangan dan analisis multi-sesi di mana kontinuitas sangat penting.

Selain pembaruan performa, Anthropic menempatkan penekanan pada keselamatan dan penerapan kemampuan yang terkendali. Model ini diperkenalkan dengan perlindungan yang dimaksudkan untuk mendeteksi dan memblokir permintaan terkait keamanan siber yang berisiko tinggi atau terlarang. Perusahaan menunjukkan bahwa rilis ini merupakan bagian dari pendekatan riset yang lebih luas di mana sistem yang kurang canggih digunakan untuk menguji mekanisme keselamatan sebelum diterapkan pada model yang lebih mampu. Meskipun performa keamanan siber umum secara sengaja dibatasi dibandingkan sistem internal yang lebih canggih, model ini tetap tersedia untuk aplikasi keamanan yang sah melalui program verifikasi yang terstruktur.

Hasil evaluasi yang dibagikan oleh perusahaan menunjukkan bahwa Opus 4.7 mempertahankan profil keselamatan yang secara umum serupa dengan pendahulunya, dengan peningkatan di beberapa area seperti ketahanan terhadap injeksi prompt dan pengurangan perilaku menyesatkan, bersama dengan regresi kecil di domain tertentu yang melibatkan panduan sensitif yang terlalu rinci. Penilaian keselarasan secara keseluruhan menggambarkan model ini sebagai cukup andal meskipun masih tidak sempurna dalam perilaku kasus pinggiran.

Rilis ini juga memperkenalkan perubahan pada kontrol operasional dan alat pengembang. Sebuah pengaturan usaha menengah baru telah ditambahkan untuk memungkinkan penyeimbangan yang lebih granular antara kualitas respons dan latensi. Fitur platform tambahan meliputi dukungan resolusi gambar yang diperluas, alat pengelolaan penggunaan token, dan perintah alur kerja yang diperbarui yang dirancang untuk meningkatkan proses review kode dan pelaksanaan tugas berbasis agen.

Opus 4.7 diterapkan di seluruh produk Anthropic sendiri serta penyedia infrastruktur eksternal, dengan harga tetap pada tingkat yang sama dengan versi sebelumnya. Pertimbangan migrasi meliputi perubahan dalam perilaku tokenisasi dan peningkatan verbose output dalam mode usaha tinggi, faktor yang mungkin mempengaruhi integrasi dalam sistem produksi tetapi dipresentasikan sebagai trade-off untuk peningkatan keandalan penalaran.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan