Google vừa phát hành một phiên bản nâng cấp của tác nhân Deep Research, hiện có sẵn cho các nhà phát triển thông qua API Tương Tác mới — với kế hoạch ra mắt người tiêu dùng sớm trong Search, NotebookLM và ứng dụng Gemini.
Công ty công nghệ Google cho biết đã ra mắt phiên bản nâng cấp đáng kể của tác nhân Deep Research, hiện có thể truy cập cho các nhà phát triển qua API Tương Tác mới, với dự kiến khả dụng cho người tiêu dùng trong Search, NotebookLM và ứng dụng Gemini.
Lần đầu tiên, các nhà phát triển có thể tích hợp khả năng nghiên cứu tự động tiên tiến nhất của Google trực tiếp vào ứng dụng của họ. Gemini Deep Research được thiết kế cho các nhiệm vụ thu thập và tổng hợp thông tin mở rộng, và hệ thống lý luận của nó được hỗ trợ bởi Gemini 3 Pro, được mô tả là mô hình có tính chính xác cao nhất của công ty đến nay. Nó đã được huấn luyện để giảm thiểu các ảo tưởng và nâng cao độ rõ ràng, độ tin cậy của các báo cáo phức tạp. Bằng cách mở rộng học tăng cường đa bước cho tìm kiếm, tác nhân có thể tự độc lập điều hướng qua các môi trường thông tin phức tạp với độ chính xác được cải thiện.
Tác nhân xây dựng quy trình nghiên cứu của mình từng bước bằng cách tạo ra các truy vấn, xem xét kết quả, xác định thông tin còn thiếu, và tiếp tục quá trình cho đến khi hoàn thành cuộc điều tra. Phiên bản mới bao gồm các nâng cấp lớn về hiệu suất tìm kiếm web, cho phép điều hướng sâu hơn vào các trang web để trích xuất dữ liệu đặc thù cao.
Theo Google, phiên bản mới nhất mang lại hiệu suất đỉnh cao trên Humanity’s Last Exam (HLE) và DeepSearchQA, đồng thời đạt kết quả mạnh nhất từ trước đến nay trên BrowseComp. Nó được tối ưu hóa để tạo ra các báo cáo được nghiên cứu kỹ lưỡng với chi phí thấp hơn đáng kể và sắp tới sẽ được tích hợp vào Google Search, NotebookLM, Google Finance, và một phiên bản nâng cấp của ứng dụng Gemini.
Việc thử nghiệm sớm đã cho thấy những cải tiến đáng kể trong các lĩnh vực đòi hỏi độ chính xác và hiểu biết ngữ cảnh chi tiết. Trong dịch vụ tài chính, các công ty đã bắt đầu sử dụng Gemini Deep Research để hợp lý hóa các giai đoạn đầu của thẩm định sơ bộ bằng cách tổng hợp các chỉ số thị trường, thông tin về đối thủ cạnh tranh và các yếu tố tuân thủ từ các nguồn công khai và độc quyền. Điều này đã biến tác nhân thành một công cụ quý giá cho các nhóm đầu tư thực hiện quy trình sơ bộ.
Trong lĩnh vực khoa học, tác nhân đang được ứng dụng cho các nghiên cứu liên quan đến an toàn phức tạp. Axiom Bio, một công ty phát triển hệ thống AI dự đoán độc tính thuốc, đã báo cáo rằng Gemini Deep Research cung cấp độ sâu phân tích ban đầu và độ chính xác trong toàn bộ tài liệu y sinh học, giúp quá trình nghiên cứu và khám phá của họ tiến triển nhanh hơn.
Đối với các nhà phát triển xây dựng hệ thống nghiên cứu tự động, tác nhân Gemini Deep Research cung cấp chức năng rộng để tổng hợp thông tin và tạo ra các báo cáo chi tiết, có thể xác minh được. Nó hỗ trợ phân tích thống nhất các tài liệu của người dùng như PDF, CSV, và tệp văn bản cùng với các nguồn web công khai bằng cách kết hợp Tải Tệp với Công Cụ Tìm Tệp.
Nó quản lý bối cảnh rộng lớn một cách hiệu quả, cho phép các nhà phát triển bao gồm lượng lớn tài liệu nền trực tiếp trong prompt. Cấu trúc đầu ra có thể được định hình qua các prompts, cho phép kiểm soát hoàn toàn bố cục báo cáo, tiêu đề, và trình bày dữ liệu. Hệ thống cung cấp các trích dẫn chi tiết cho các tuyên bố, đảm bảo minh bạch về nguồn dữ liệu, và hỗ trợ đầu ra có cấu trúc, bao gồm các sơ đồ JSON, để tích hợp dễ dàng vào các ứng dụng phía sau.
Google Mở Nguồn Benchmark DeepSearchQA Để Tiến Bộ Trong Khả Năng Nghiên Cứu Web Đa Bước
Ngoài ra, Google công bố mở nguồn một benchmark mới gọi là DeepSearchQA, được tạo ra để đánh giá khả năng xử lý các tác vụ truy vấn phức tạp, đa bước dựa trên web một cách hiệu quả của các tác nhân nghiên cứu. DeepSearchQA gồm 900 nhiệm vụ chuỗi nguyên nhân nhân tạo thủ công trải dài 17 lĩnh vực, mỗi bước dựa trên kết luận của bước trước. Thay vì dựa vào các câu hỏi đơn giản về truy xuất sự thật, benchmark này đo lường khả năng của tác nhân trong việc đưa ra bộ câu trả lời đầy đủ và toàn diện, cho phép đánh giá cả độ chính xác nghiên cứu và phạm vi truy xuất.
DeepSearchQA cũng nhằm mục đích là nguồn chẩn đoán để nghiên cứu ảnh hưởng của thời gian suy luận kéo dài. Các thử nghiệm nội bộ cho thấy hiệu suất cải thiện khi các tác nhân có nhiều cơ hội hơn để chạy các tìm kiếm và chu kỳ suy luận bổ sung, điều mà Google dự kiến sẽ mở rộng trong các phiên bản tương lai.
Các tài liệu của benchmark đang được phát hành nhằm khuyến khích tiến bộ liên tục hướng tới các tác nhân nghiên cứu có khả năng hơn. Các nhà phát triển và nhà nghiên cứu có thể xem xét bộ dữ liệu, bảng xếp hạng, và Colab khởi đầu, cũng như nghiên cứu phương pháp luận nền tảng mô tả trong báo cáo kỹ thuật đi kèm.
Mặc dù lĩnh vực Deep Research đã rất cạnh tranh, nhưng tác nhân cập nhật của Google giới thiệu những cải tiến đáng chú ý dựa trên khả năng của các mô hình Gemini 3 hiện tại. Việc phát hành này cũng đánh dấu lần đầu tiên các nhà phát triển có thể tích hợp trực tiếp công nghệ này vào ứng dụng của riêng họ, mang lại một cải tiến đáng kể cho chức năng nghiên cứu trong các sản phẩm của bên thứ ba.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Google phát hành Trình Khám Phá Sâu Được Nâng Cấp Với API Tương Tác Mới Dành Cho Nhà Phát Triển
Tóm tắt
Google vừa phát hành một phiên bản nâng cấp của tác nhân Deep Research, hiện có sẵn cho các nhà phát triển thông qua API Tương Tác mới — với kế hoạch ra mắt người tiêu dùng sớm trong Search, NotebookLM và ứng dụng Gemini.
Công ty công nghệ Google cho biết đã ra mắt phiên bản nâng cấp đáng kể của tác nhân Deep Research, hiện có thể truy cập cho các nhà phát triển qua API Tương Tác mới, với dự kiến khả dụng cho người tiêu dùng trong Search, NotebookLM và ứng dụng Gemini.
Lần đầu tiên, các nhà phát triển có thể tích hợp khả năng nghiên cứu tự động tiên tiến nhất của Google trực tiếp vào ứng dụng của họ. Gemini Deep Research được thiết kế cho các nhiệm vụ thu thập và tổng hợp thông tin mở rộng, và hệ thống lý luận của nó được hỗ trợ bởi Gemini 3 Pro, được mô tả là mô hình có tính chính xác cao nhất của công ty đến nay. Nó đã được huấn luyện để giảm thiểu các ảo tưởng và nâng cao độ rõ ràng, độ tin cậy của các báo cáo phức tạp. Bằng cách mở rộng học tăng cường đa bước cho tìm kiếm, tác nhân có thể tự độc lập điều hướng qua các môi trường thông tin phức tạp với độ chính xác được cải thiện.
Tác nhân xây dựng quy trình nghiên cứu của mình từng bước bằng cách tạo ra các truy vấn, xem xét kết quả, xác định thông tin còn thiếu, và tiếp tục quá trình cho đến khi hoàn thành cuộc điều tra. Phiên bản mới bao gồm các nâng cấp lớn về hiệu suất tìm kiếm web, cho phép điều hướng sâu hơn vào các trang web để trích xuất dữ liệu đặc thù cao.
Theo Google, phiên bản mới nhất mang lại hiệu suất đỉnh cao trên Humanity’s Last Exam (HLE) và DeepSearchQA, đồng thời đạt kết quả mạnh nhất từ trước đến nay trên BrowseComp. Nó được tối ưu hóa để tạo ra các báo cáo được nghiên cứu kỹ lưỡng với chi phí thấp hơn đáng kể và sắp tới sẽ được tích hợp vào Google Search, NotebookLM, Google Finance, và một phiên bản nâng cấp của ứng dụng Gemini.
Việc thử nghiệm sớm đã cho thấy những cải tiến đáng kể trong các lĩnh vực đòi hỏi độ chính xác và hiểu biết ngữ cảnh chi tiết. Trong dịch vụ tài chính, các công ty đã bắt đầu sử dụng Gemini Deep Research để hợp lý hóa các giai đoạn đầu của thẩm định sơ bộ bằng cách tổng hợp các chỉ số thị trường, thông tin về đối thủ cạnh tranh và các yếu tố tuân thủ từ các nguồn công khai và độc quyền. Điều này đã biến tác nhân thành một công cụ quý giá cho các nhóm đầu tư thực hiện quy trình sơ bộ.
Trong lĩnh vực khoa học, tác nhân đang được ứng dụng cho các nghiên cứu liên quan đến an toàn phức tạp. Axiom Bio, một công ty phát triển hệ thống AI dự đoán độc tính thuốc, đã báo cáo rằng Gemini Deep Research cung cấp độ sâu phân tích ban đầu và độ chính xác trong toàn bộ tài liệu y sinh học, giúp quá trình nghiên cứu và khám phá của họ tiến triển nhanh hơn.
Đối với các nhà phát triển xây dựng hệ thống nghiên cứu tự động, tác nhân Gemini Deep Research cung cấp chức năng rộng để tổng hợp thông tin và tạo ra các báo cáo chi tiết, có thể xác minh được. Nó hỗ trợ phân tích thống nhất các tài liệu của người dùng như PDF, CSV, và tệp văn bản cùng với các nguồn web công khai bằng cách kết hợp Tải Tệp với Công Cụ Tìm Tệp.
Nó quản lý bối cảnh rộng lớn một cách hiệu quả, cho phép các nhà phát triển bao gồm lượng lớn tài liệu nền trực tiếp trong prompt. Cấu trúc đầu ra có thể được định hình qua các prompts, cho phép kiểm soát hoàn toàn bố cục báo cáo, tiêu đề, và trình bày dữ liệu. Hệ thống cung cấp các trích dẫn chi tiết cho các tuyên bố, đảm bảo minh bạch về nguồn dữ liệu, và hỗ trợ đầu ra có cấu trúc, bao gồm các sơ đồ JSON, để tích hợp dễ dàng vào các ứng dụng phía sau.
Google Mở Nguồn Benchmark DeepSearchQA Để Tiến Bộ Trong Khả Năng Nghiên Cứu Web Đa Bước
Ngoài ra, Google công bố mở nguồn một benchmark mới gọi là DeepSearchQA, được tạo ra để đánh giá khả năng xử lý các tác vụ truy vấn phức tạp, đa bước dựa trên web một cách hiệu quả của các tác nhân nghiên cứu. DeepSearchQA gồm 900 nhiệm vụ chuỗi nguyên nhân nhân tạo thủ công trải dài 17 lĩnh vực, mỗi bước dựa trên kết luận của bước trước. Thay vì dựa vào các câu hỏi đơn giản về truy xuất sự thật, benchmark này đo lường khả năng của tác nhân trong việc đưa ra bộ câu trả lời đầy đủ và toàn diện, cho phép đánh giá cả độ chính xác nghiên cứu và phạm vi truy xuất.
DeepSearchQA cũng nhằm mục đích là nguồn chẩn đoán để nghiên cứu ảnh hưởng của thời gian suy luận kéo dài. Các thử nghiệm nội bộ cho thấy hiệu suất cải thiện khi các tác nhân có nhiều cơ hội hơn để chạy các tìm kiếm và chu kỳ suy luận bổ sung, điều mà Google dự kiến sẽ mở rộng trong các phiên bản tương lai.
Các tài liệu của benchmark đang được phát hành nhằm khuyến khích tiến bộ liên tục hướng tới các tác nhân nghiên cứu có khả năng hơn. Các nhà phát triển và nhà nghiên cứu có thể xem xét bộ dữ liệu, bảng xếp hạng, và Colab khởi đầu, cũng như nghiên cứu phương pháp luận nền tảng mô tả trong báo cáo kỹ thuật đi kèm.
Mặc dù lĩnh vực Deep Research đã rất cạnh tranh, nhưng tác nhân cập nhật của Google giới thiệu những cải tiến đáng chú ý dựa trên khả năng của các mô hình Gemini 3 hiện tại. Việc phát hành này cũng đánh dấu lần đầu tiên các nhà phát triển có thể tích hợp trực tiếp công nghệ này vào ứng dụng của riêng họ, mang lại một cải tiến đáng kể cho chức năng nghiên cứu trong các sản phẩm của bên thứ ba.