Mengamati langkah terbaru NVIDIA di ruang AI perusahaan dan layak diperhatikan. Mereka baru saja merilis Nemotron 3 Super—model dengan 120 miliar parameter yang dirancang khusus untuk alur kerja AI agenik, dan waktunya memberi tahu Anda tentang ke mana uang nyata sedang mengarah.



Inilah yang menarik perhatian saya: masalah inti yang mereka selesaikan sebenarnya cukup spesifik untuk cara kerja sistem multi-agen dalam produksi. Ketika Anda menjalankan beberapa agen AI yang perlu berkoordinasi, Anda cepat menemui hambatan ini. Setiap interaksi agen menghasilkan riwayat percakapan lengkap, output alat, rantai penalaran—yang menyebabkan penggunaan token membengkak hingga 15x dibandingkan chatbot dasar. Itu menjadi mahal saat dijalankan dalam skala perusahaan. Nemotron 3 Super mengatasi ini dengan jendela konteks 1 juta token, memungkinkan agen memegang seluruh status alur kerja tanpa perlu pemrosesan ulang terus-menerus.

Pilihan arsitektur di sini lebih penting daripada spesifikasi utama. Mereka menggunakan desain hybrid campuran pakar di mana hanya 12 miliar parameter yang aktif selama inferensi, meskipun totalnya 120 miliar. Keuntungan efisiensi ini berlipat ganda—dengan prediksi multi-token, mereka mengklaim inferensi 3x lebih cepat. Di perangkat keras Blackwell, Anda melihat peningkatan kecepatan 4x dibandingkan generasi sebelumnya tanpa penurunan akurasi.

Yang benar-benar menunjukkan adalah daftar adopsi. Perplexity langsung mengintegrasikannya. CodeRabbit, Factory, dan Greptile mengintegrasikannya ke dalam agen pengkodean AI mereka. Tapi permainan industri yang lebih berat lebih menarik—Siemens, Dassault Systèmes, dan Cadence untuk manufaktur dan otomatisasi desain. Palantir dan Amdocs untuk keamanan siber dan telekomunikasi. Ini bukan sekadar hype adopsi; ini perusahaan yang menerapkan sistem agen untuk alur kerja nyata.

Ketersediaan di cloud akan diluncurkan di Google Cloud, Oracle, dengan AWS dan Azure segera menyusul. Penyedia inferensi seperti Fireworks AI dan DeepInfra sudah menggunakannya. Distribusi ini penting karena menandakan kepercayaan terhadap permintaan yang berkelanjutan.

Satu hal yang menonjol: NVIDIA merilis open-source ini lengkap dengan bobot dan data pelatihan lebih dari 10 triliun token. Itu adalah langkah strategis—Anda tidak hanya menjual model, tetapi membangun ekosistem di mana Blackwell menjadi perangkat keras default untuk menjalankan AI agenik tingkat perusahaan. Model ini menduduki puncak leaderboard efisiensi Analisis Buatan, yang membuktikan keunggulan rekayasa.

Bagi investor yang mengikuti ini, Nemotron 3 Super lebih dari sekadar model itu sendiri; ini adalah sinyal dari NVIDIA tentang ke mana sebenarnya AI perusahaan akan menuju—menuju sistem agen khusus yang membutuhkan komputasi serius. Pertanyaan sebenarnya adalah apakah penerapan ini akan menghasilkan permintaan Blackwell yang berkelanjutan hingga akhir 2026. Tanda-tanda awal menunjukkan bahwa mereka akan.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan