Google baru saja merilis versi terbaru dari agen Deep Research-nya yang telah ditingkatkan, kini tersedia untuk pengembang melalui API Interactions baru — dengan peluncuran untuk konsumen segera hadir di Search, NotebookLM, dan aplikasi Gemini.
Perusahaan teknologi Google menyatakan bahwa mereka telah merilis versi yang secara substansial ditingkatkan dari agen Deep Research mereka, kini dapat diakses oleh pengembang melalui API Interactions baru, dengan ketersediaan untuk konsumen yang direncanakan untuk Search, NotebookLM, dan aplikasi Gemini.
Untuk pertama kalinya, pengembang dapat mengintegrasikan kemampuan riset otomatis paling canggih dari Google langsung ke dalam aplikasi mereka sendiri. Gemini Deep Research dirancang untuk tugas pengumpulan informasi dan sintesis yang diperluas, dan sistem penalarannya didukung oleh Gemini 3 Pro, yang digambarkan sebagai model paling faktual dari perusahaan tersebut hingga saat ini. Model ini telah dilatih untuk mengurangi halusinasi dan meningkatkan kejelasan serta keandalan laporan yang kompleks. Dengan memperluas pembelajaran penguatan multi-langkah untuk pencarian, agen dapat secara mandiri menavigasi lingkungan informasi yang rumit dengan akurasi yang lebih baik.
Agen membangun alur risetnya langkah demi langkah dengan menghasilkan kueri, meninjau hasil, mengidentifikasi kekurangan informasi, dan melanjutkan proses hingga penyelidikan selesai. Rilis baru ini mencakup peningkatan besar pada kinerja pencarian web, memungkinkan navigasi yang lebih dalam ke dalam situs web untuk mengekstrak data yang sangat spesifik.
Menurut Google, versi terbaru ini memberikan performa mutakhir di Humanity’s Last Exam (HLE) dan DeepSearchQA, sekaligus mencapai hasil terkuatnya hingga saat ini di BrowseComp. Ini dioptimalkan untuk menghasilkan laporan yang didukung riset secara mendalam dengan biaya yang jauh lebih rendah dan segera akan diintegrasikan ke dalam Google Search, NotebookLM, Google Finance, dan versi yang ditingkatkan dari aplikasi Gemini.
Pengujian awal sudah menunjukkan peningkatan yang substansial di bidang-bidang di mana akurasi dan pemahaman konteks yang rinci sangat penting. Dalam layanan keuangan, perusahaan-perusahaan telah mulai menggunakan Gemini Deep Research untuk mempercepat fase awal uji kelayakan dengan mengumpulkan indikator pasar, wawasan pesaing, dan pertimbangan kepatuhan dari sumber publik maupun sumber milik sendiri. Hal ini menjadikan agen sebagai alat yang berharga bagi tim investasi yang melakukan alur kerja awal.
Dalam sektor ilmiah, agen ini digunakan untuk riset terkait keselamatan yang kompleks. Axiom Bio, sebuah perusahaan yang mengembangkan sistem AI untuk memprediksi toksisitas obat, melaporkan bahwa Gemini Deep Research menyediakan kedalaman analisis awal dan presisi di seluruh literatur biomedis yang memungkinkan proses riset dan penemuan mereka berjalan lebih cepat.
Bagi pengembang yang membangun sistem riset otomatis, agen Gemini Deep Research menawarkan fungsi luas untuk mensintesis informasi dan menghasilkan laporan rinci yang dapat diverifikasi. Agen ini mendukung analisis terpadu terhadap dokumen pengguna seperti PDF, CSV, dan file teks bersamaan dengan sumber web publik melalui kombinasi File Upload dan File Search Tool.
Agen ini mampu mengelola konteks yang luas secara efektif, memungkinkan pengembang menyertakan sejumlah besar materi latar belakang langsung dalam prompt. Struktur output dapat dibentuk melalui prompting, memberi kendali penuh atas tata letak laporan, judul, dan penyajian data. Sistem ini menyediakan kutipan granular untuk klaim, memastikan transparansi mengenai asal-usul data, dan mendukung output terstruktur, termasuk skema JSON, untuk integrasi yang lebih lancar ke dalam aplikasi downstream.
Google Buka Sumber Benchmark DeepSearchQA untuk Meningkatkan Kemampuan Riset Web Multi-Langkah
Selain itu, Google mengumumkan bahwa mereka membuka sumber benchmark baru bernama DeepSearchQA, yang dibuat untuk mengevaluasi seberapa efektif agen riset menangani pertanyaan berbasis web yang komprehensif dan multi-langkah. DeepSearchQA mencakup 900 tugas rantai sebab-akibat yang dibuat secara manual yang mencakup 17 bidang subjek, dengan setiap langkah membangun dari kesimpulan langkah sebelumnya. Alih-alih bergantung pada pertanyaan sederhana tentang fakta, benchmark ini mengukur kemampuan agen untuk menghasilkan set jawaban yang lengkap dan menyeluruh, memungkinkan penilaian terhadap akurasi riset dan cakupan pengambilan data.
DeepSearchQA juga dimaksudkan sebagai sumber diagnostik untuk mempelajari efek dari waktu penalaran yang diperpanjang. Pengujian internal menunjukkan bahwa performa meningkat saat agen diberi lebih banyak kesempatan untuk melakukan pencarian dan siklus penalaran tambahan, area yang diharapkan Google akan dikembangkan lebih lanjut di iterasi mendatang.
Materi benchmark ini dirilis untuk mendorong kemajuan berkelanjutan menuju agen riset yang lebih mampu. Pengembang dan peneliti dapat meninjau dataset, leaderboard, dan Colab pemula, serta memeriksa metodologi dasar yang dijelaskan dalam laporan teknis yang menyertainya.
Meskipun lanskap Deep Research sudah sangat kompetitif, agen terbaru dari Google menghadirkan peningkatan yang signifikan yang membangun kemampuan dari model Gemini 3 yang ada. Rilis ini juga menandai pertama kalinya pengembang dapat mengintegrasikan teknologi ini langsung ke dalam aplikasi mereka sendiri, menawarkan peningkatan besar terhadap fungsi riset dalam produk pihak ketiga.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
Google Merilis Agen Penelitian Mendalam yang Ditingkatkan Dengan API Interaksi Baru Untuk Pengembang
Ringkasan
Google baru saja merilis versi terbaru dari agen Deep Research-nya yang telah ditingkatkan, kini tersedia untuk pengembang melalui API Interactions baru — dengan peluncuran untuk konsumen segera hadir di Search, NotebookLM, dan aplikasi Gemini.
Perusahaan teknologi Google menyatakan bahwa mereka telah merilis versi yang secara substansial ditingkatkan dari agen Deep Research mereka, kini dapat diakses oleh pengembang melalui API Interactions baru, dengan ketersediaan untuk konsumen yang direncanakan untuk Search, NotebookLM, dan aplikasi Gemini.
Untuk pertama kalinya, pengembang dapat mengintegrasikan kemampuan riset otomatis paling canggih dari Google langsung ke dalam aplikasi mereka sendiri. Gemini Deep Research dirancang untuk tugas pengumpulan informasi dan sintesis yang diperluas, dan sistem penalarannya didukung oleh Gemini 3 Pro, yang digambarkan sebagai model paling faktual dari perusahaan tersebut hingga saat ini. Model ini telah dilatih untuk mengurangi halusinasi dan meningkatkan kejelasan serta keandalan laporan yang kompleks. Dengan memperluas pembelajaran penguatan multi-langkah untuk pencarian, agen dapat secara mandiri menavigasi lingkungan informasi yang rumit dengan akurasi yang lebih baik.
Agen membangun alur risetnya langkah demi langkah dengan menghasilkan kueri, meninjau hasil, mengidentifikasi kekurangan informasi, dan melanjutkan proses hingga penyelidikan selesai. Rilis baru ini mencakup peningkatan besar pada kinerja pencarian web, memungkinkan navigasi yang lebih dalam ke dalam situs web untuk mengekstrak data yang sangat spesifik.
Menurut Google, versi terbaru ini memberikan performa mutakhir di Humanity’s Last Exam (HLE) dan DeepSearchQA, sekaligus mencapai hasil terkuatnya hingga saat ini di BrowseComp. Ini dioptimalkan untuk menghasilkan laporan yang didukung riset secara mendalam dengan biaya yang jauh lebih rendah dan segera akan diintegrasikan ke dalam Google Search, NotebookLM, Google Finance, dan versi yang ditingkatkan dari aplikasi Gemini.
Pengujian awal sudah menunjukkan peningkatan yang substansial di bidang-bidang di mana akurasi dan pemahaman konteks yang rinci sangat penting. Dalam layanan keuangan, perusahaan-perusahaan telah mulai menggunakan Gemini Deep Research untuk mempercepat fase awal uji kelayakan dengan mengumpulkan indikator pasar, wawasan pesaing, dan pertimbangan kepatuhan dari sumber publik maupun sumber milik sendiri. Hal ini menjadikan agen sebagai alat yang berharga bagi tim investasi yang melakukan alur kerja awal.
Dalam sektor ilmiah, agen ini digunakan untuk riset terkait keselamatan yang kompleks. Axiom Bio, sebuah perusahaan yang mengembangkan sistem AI untuk memprediksi toksisitas obat, melaporkan bahwa Gemini Deep Research menyediakan kedalaman analisis awal dan presisi di seluruh literatur biomedis yang memungkinkan proses riset dan penemuan mereka berjalan lebih cepat.
Bagi pengembang yang membangun sistem riset otomatis, agen Gemini Deep Research menawarkan fungsi luas untuk mensintesis informasi dan menghasilkan laporan rinci yang dapat diverifikasi. Agen ini mendukung analisis terpadu terhadap dokumen pengguna seperti PDF, CSV, dan file teks bersamaan dengan sumber web publik melalui kombinasi File Upload dan File Search Tool.
Agen ini mampu mengelola konteks yang luas secara efektif, memungkinkan pengembang menyertakan sejumlah besar materi latar belakang langsung dalam prompt. Struktur output dapat dibentuk melalui prompting, memberi kendali penuh atas tata letak laporan, judul, dan penyajian data. Sistem ini menyediakan kutipan granular untuk klaim, memastikan transparansi mengenai asal-usul data, dan mendukung output terstruktur, termasuk skema JSON, untuk integrasi yang lebih lancar ke dalam aplikasi downstream.
Google Buka Sumber Benchmark DeepSearchQA untuk Meningkatkan Kemampuan Riset Web Multi-Langkah
Selain itu, Google mengumumkan bahwa mereka membuka sumber benchmark baru bernama DeepSearchQA, yang dibuat untuk mengevaluasi seberapa efektif agen riset menangani pertanyaan berbasis web yang komprehensif dan multi-langkah. DeepSearchQA mencakup 900 tugas rantai sebab-akibat yang dibuat secara manual yang mencakup 17 bidang subjek, dengan setiap langkah membangun dari kesimpulan langkah sebelumnya. Alih-alih bergantung pada pertanyaan sederhana tentang fakta, benchmark ini mengukur kemampuan agen untuk menghasilkan set jawaban yang lengkap dan menyeluruh, memungkinkan penilaian terhadap akurasi riset dan cakupan pengambilan data.
DeepSearchQA juga dimaksudkan sebagai sumber diagnostik untuk mempelajari efek dari waktu penalaran yang diperpanjang. Pengujian internal menunjukkan bahwa performa meningkat saat agen diberi lebih banyak kesempatan untuk melakukan pencarian dan siklus penalaran tambahan, area yang diharapkan Google akan dikembangkan lebih lanjut di iterasi mendatang.
Materi benchmark ini dirilis untuk mendorong kemajuan berkelanjutan menuju agen riset yang lebih mampu. Pengembang dan peneliti dapat meninjau dataset, leaderboard, dan Colab pemula, serta memeriksa metodologi dasar yang dijelaskan dalam laporan teknis yang menyertainya.
Meskipun lanskap Deep Research sudah sangat kompetitif, agen terbaru dari Google menghadirkan peningkatan yang signifikan yang membangun kemampuan dari model Gemini 3 yang ada. Rilis ini juga menandai pertama kalinya pengembang dapat mengintegrasikan teknologi ini langsung ke dalam aplikasi mereka sendiri, menawarkan peningkatan besar terhadap fungsi riset dalam produk pihak ketiga.