Google nâng cấp Gemini Deep Research Max: tích hợp MCP có thể kết nối cơ sở dữ liệu nội bộ doanh nghiệp, biểu đồ gốc, thực hiện công việc thẩm định của nhà phân tích

robot
Đang tạo bản tóm tắt

Google công bố nâng cấp lớn Gemini Deep Research, ra mắt hai loại Agent mới Deep Research và Deep Research Max, tích hợp mô hình Gemini 3.1 Pro mới nhất, và kết nối qua giao thức MCP với các nền tảng dữ liệu tài chính như FactSet, S&P Global, PitchBook hoặc dữ liệu nội bộ doanh nghiệp.
(Thông tin trước đó: OpenAI mở khóa Deep Research: người dùng trả phí có thể truy vấn 10 lần mỗi tháng, Microsoft ra mắt AI agent đa chế độ Magma)
(Thông tin bổ sung: OpenAI ra mắt “ChatGPT Agent”! Kết hợp Operator và Deep Research: đặt vé, gọi đồ ăn, viết báo cáo đều thành công)

Mục lục bài viết

Toggle

  • Max là gì: suy nghĩ lâu hơn để có câu trả lời sâu hơn
  • Hỗ trợ MCP: từ tìm kiếm trên mạng chuyển sang “tìm kiếm trong bất kỳ cơ sở dữ liệu nào”
  • Ba đột phá chức năng lớn: biểu đồ, lập kế hoạch hợp tác, truyền phát trực tiếp
  • AI Agent vượt qua giới hạn “trợ lý tìm kiếm”

Google hôm qua (21) thông báo nâng cấp lớn Gemini Deep Research, đồng thời ra mắt hai loại Agent: Deep Research (ưu tiên tốc độ) và Deep Research Max (ưu tiên chất lượng), tích hợp toàn diện Gemini 3.1 Pro, và lần đầu tiên qua dịch vụ API Gemini để thử nghiệm đại chúng.

Max là gì: suy nghĩ lâu hơn để có câu trả lời sâu hơn

Điểm khác biệt cốt lõi của Deep Research Max nằm ở “tính toán mở rộng thời gian thử nghiệm”. Agent không chỉ chạy một lần rồi hoàn thành, mà liên tục suy luận, tìm kiếm, chỉnh sửa, như một trợ lý nghiên cứu không ngủ không nghỉ, cho đến khi nó cảm thấy báo cáo đạt tiêu chuẩn mới xuất ra.

Google chính thức cho biết, Max đã có bước nhảy vọt “đột phá” về khả năng trích xuất và suy luận theo tiêu chuẩn ngành, so với bản xem trước tháng 12 năm ngoái, số nguồn tham khảo đã tăng đáng kể, có thể phát hiện các khác biệt quan trọng bị bỏ qua trước đó, và chủ động trích dẫn các nguồn uy tín như hồ sơ SEC, tạp chí bình duyệt đồng nghiệp khi cân nhắc bằng chứng mâu thuẫn.

Người dùng có thể đặt lịch chạy vào ban đêm, sáng hôm sau đội ngũ phân tích đã có báo cáo đầy đủ trong hộp thư đến. Tốc độ không phải là yếu tố chính, mà chiều sâu mới là điều quan trọng.

Ngược lại, phiên bản tiêu chuẩn Deep Research tập trung giảm đáng kể độ trễ và chi phí, thay thế bản xem trước tháng 12 thành tùy chọn mặc định trong các kịch bản tương tác (khi người dùng cần hỏi đáp nhanh, không cần khai thác sâu như Max).

Hỗ trợ MCP: từ tìm kiếm trên mạng chuyển sang “tìm kiếm trong bất kỳ cơ sở dữ liệu nào”

Lần nâng cấp này của Deep Research cũng hỗ trợ gốc cho MCP (Giao thức Ngữ cảnh Mô hình). Trước đây, Agent chỉ có thể lấy thông tin từ mạng công cộng, nay qua MCP, nó có thể kết nối liền mạch với nguồn dữ liệu tùy chỉnh của doanh nghiệp và luồng dữ liệu chuyên nghiệp.

Ý nghĩa thực tế là: bộ phận tài chính có thể kết nối hệ thống ERP nội bộ, nhà cung cấp dữ liệu thị trường qua API riêng qua máy chủ MCP, và Deep Research có thể trong cùng một quy trình nghiên cứu, đồng thời truy vấn dữ liệu công khai, dữ liệu từ Bloomberg Terminal, dữ liệu nội bộ, ba luồng song song mà không cần chuyển đổi thủ công các công cụ.

Google cũng công bố hợp tác với FactSet, S&P Global, PitchBook, ba tổ chức cùng thiết kế máy chủ MCP, giúp khách hàng tích hợp trực tiếp dữ liệu tài chính và thị trường của các nền tảng này vào quy trình làm việc của Deep Research. Đối với ngân hàng đầu tư, quỹ tư nhân, tổ chức nghiên cứu thị trường, ý nghĩa của cầu nối này rõ ràng.

Trong bộ công cụ, người dùng có thể kích hoạt cùng lúc Google Search, MCP từ xa, Ngữ cảnh URL, Thực thi mã, Tìm kiếm tệp; hoặc tắt hoàn toàn mạng, để Agent chỉ hoạt động trong cơ sở dữ liệu tùy chỉnh, điều này đặc biệt quan trọng đối với các doanh nghiệp lo ngại rò rỉ dữ liệu.

Ba đột phá chức năng lớn: biểu đồ, lập kế hoạch hợp tác, truyền phát trực tiếp

Thứ nhất là biểu đồ và infographic gốc. Đây là lần đầu tiên trên API Gemini, Deep Research không còn chỉ đưa ra văn bản, mà còn có thể trực tiếp tạo ra biểu đồ HTML hoặc infographic Nano Banana, nâng cấp báo cáo nghiên cứu từ dạng văn bản thuần túy thành dạng phân tích trực quan.

Thứ hai là lập kế hoạch hợp tác. Trước khi thực hiện nghiên cứu, Agent sẽ tạo ra một kế hoạch nghiên cứu, người dùng có thể xem, hướng dẫn, chỉnh sửa kế hoạch này trước khi để Agent thực thi. Điều này giúp kiểm soát phạm vi điều tra chi tiết hơn, không còn là “gửi một câu hỏi, chờ một báo cáo” dạng hộp đen, mà là hợp tác định nghĩa khung nghiên cứu.

Thứ ba là truyền phát trực tiếp. Hệ thống theo dõi các bước suy luận trung gian của Agent, live thought summary cho phép người dùng xem ngay quá trình Agent đang làm gì, các dòng chữ và hình ảnh được tạo ra và gửi về cùng lúc, giảm thiểu đáng kể cảm giác chờ đợi kéo dài.

Về mặt grounding đa chế độ, Deep Research hiện có thể tiếp nhận PDF, CSV, hình ảnh, âm thanh, video làm đầu vào, tích hợp dữ liệu đa định dạng mà không cần xử lý thủ công.

AI Agent vượt qua giới hạn “trợ lý tìm kiếm”

Sự xuất hiện của Deep Research Max phần nào đánh dấu giai đoạn trưởng thành mới của AI Agent trong quy trình nghiên cứu doanh nghiệp. Trước đây, chúng ta nói về AI hỗ trợ nghiên cứu chủ yếu dừng lại ở “tóm tắt tài liệu” hoặc “tìm kiếm vài bài báo”, về cơ bản là trợ lý tìm kiếm tự động.

Nhưng khi Agent có thể liên tục suy luận, tự cân nhắc các bằng chứng mâu thuẫn, trích dẫn hồ sơ SEC, và kết nối qua MCP với dữ liệu tài chính nội bộ, nó đã gần như thực hiện các công việc của một nhà phân tích sơ cấp trong quá trình điều tra.

Tất nhiên, “gần như” không đồng nghĩa “thay thế”. Làm thế nào để xác minh logic suy luận của Agent, quản lý quyền truy cập dữ liệu riêng tư, và sử dụng kết quả nghiên cứu do AI tạo ra trong môi trường pháp lý, là những vấn đề doanh nghiệp vẫn đang khám phá. Nhưng tín hiệu rõ ràng từ Google hôm nay là: về mặt công nghệ, con đường này đã mở.

Deep Research và Deep Research Max hiện đã có thể truy cập qua dịch vụ API Gemini trong chế độ xem trước công khai, phiên bản Google Cloud cũng sẽ sớm ra mắt. Thông báo đầy đủ xem tại Blog chính thức của Google.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim