Quét để tải ứng dụng Gate
qrCode
Thêm tùy chọn tải xuống
Không cần nhắc lại hôm nay

Đầu tư Ark: Google Nano Banana Pro khá xuất sắc, nhưng mức độ áp dụng vẫn không bằng ChatGPT.

Đầu tư Ark (ARK Invest) Cuộc thảo luận mới nhất chỉ ra rằng, Gemini 3 do Google phát hành tuy đã thành công trở lại trong danh sách các mô hình hàng đầu, nhưng bản cập nhật lần này không phải là khả năng ngôn ngữ mà là mô hình tạo hình ảnh và thông tin hoàn toàn mới “Nano Banana Pro”. Nhóm Ark tin rằng, bản cập nhật này của Google thể hiện rằng công nghệ AI của họ đã trở lại vị trí hàng đầu, nhưng vẫn phải đối mặt với những thách thức trong việc chấp nhận của người dùng và chiến lược thương mại hóa.

Gemini 3 phản hồi lại những nghi ngờ, Google nhấn mạnh rằng định luật mở rộng AI vẫn còn hiệu lực.

ARK chỉ ra rằng, Gemini 3 mới được Google phát hành đã đứng đầu trong nhiều bài kiểm tra chuẩn, qua đó phản bác lại những nghi ngờ bên ngoài về “hiệu suất giảm dần của mô hình lớn”. Đội ngũ kỹ sư của Google cho biết, việc mở rộng quy mô vẫn mang lại những lợi ích rõ rệt, cho thấy khả năng huấn luyện đã được cải thiện đáng kể.

Về trải nghiệm thực tế, Giám đốc Nghiên cứu AI của Ark, Downing, cho biết, Gemini 3 đã có thể tương tác với khả năng xử lý của ChatGPT (5.1 Thinking) trong hầu hết các nhiệm vụ, cả hai đều có những ưu điểm riêng. Ông cho rằng, việc Google tích hợp các chức năng như bộ nhớ và cá nhân hóa vào Gemini lần này là chìa khóa giúp sản phẩm trưởng thành hơn rất nhiều.

Nano Banana Pro mới thật sự là bước đột phá lớn.

So với mô hình ngôn ngữ, Ark cho rằng hiệu suất của Nano Banana Pro mang tính cách mạng hơn. Mô hình này có thể cô đọng một lượng lớn văn bản thành hình ảnh, bài thuyết trình, sơ đồ quy trình và các thông tin có cấu trúc khác, thậm chí còn có thể xuất chính xác văn bản trong hình ảnh, điều mà hầu hết các mô hình trước đây vẫn khó vượt qua.

ARK chỉ ra rằng khả năng này có giá trị ứng dụng cao đối với việc sáng tạo nội dung, tài liệu tiếp thị và công việc thông tin trực quan, cho thấy Google đang dẫn đầu rõ ràng trong việc tạo hình ảnh và hiểu biết trực quan.

Cấu trúc AI tích hợp ngôn ngữ và hình ảnh, Google có lợi thế tiên phong.

Chuyên gia tương lai hàng đầu của Ark, Winton, cho rằng kiến trúc tương lai của AI sẽ tích hợp suy diễn ngôn ngữ, tạo hình ảnh và hệ thống bộ nhớ dài hạn, trong khi Google đã có sự đầu tư vào cả ba công nghệ này, bao gồm cấu trúc bộ nhớ Titans đã được phát hành trước đó.

Gemini 3 và Nano Banana Pro được coi là chìa khóa quan trọng cho Google trong việc hướng tới kiến trúc AI thế hệ tiếp theo.

Google và OpenAI đối đầu trực tiếp, chức năng ghi nhớ là chiến trường mới

ARK chỉ ra rằng, trí nhớ đa cuộc trò chuyện đang trở thành chìa khóa giữ chân người dùng trên nền tảng. Sau khi tính năng trí nhớ đa cuộc trò chuyện của ChatGPT ra mắt, nó có thể ghi nhớ sở thích và bối cảnh của người dùng, làm tăng đáng kể sự gắn bó.

Google đã đồng bộ hóa thiết kế tương tự trong Gemini, cho thấy cả hai bên đã coi trí nhớ là trọng tâm cạnh tranh tiếp theo. Tuy nhiên, Ark cho rằng việc quên đi các cuộc hội thoại dài và khó khăn trong việc chuyển nhượng nội dung lịch sử vẫn là thách thức mà toàn ngành cần cùng nhau vượt qua.

TPU đối đầu GB200, cả hai mô hình đều chọn NVIDIA chiến thắng

Cần lưu ý rằng khi ARK hỏi Gemini 3 và ChatGPT về “sự khác biệt về hiệu suất / tiêu thụ năng lượng giữa Google TPU v7 và NVIDIA GB200”, cả hai đều đưa ra cùng một kết luận, đó là NVIDIA vẫn chiếm ưu thế về tỷ lệ hiệu suất / tiêu thụ năng lượng.

ARK chỉ ra rằng, mặc dù Google có lợi thế chi phí trong chi tiêu vốn nhờ vào TPU tự phát triển, nhưng việc huấn luyện và suy diễn AI đang nhanh chóng bị giới hạn bởi “điện lực”. Khi điện năng trở thành nút thắt mới cho AI sinh sinh, tỷ lệ hiệu suất / tiêu thụ điện sẽ trực tiếp quyết định số lượng token mà mô hình có thể xuất ra trên mỗi watt điện, và cũng sẽ ảnh hưởng đến hiệu quả hoạt động tổng thể và giới hạn doanh thu.

(Sự khác biệt về công nghệ giữa GPU của Nvidia và TPU của Google cũng như chip AI tự phát triển của Amazon AWS và xu hướng thị trường trong tương lai)

YouTube Premium nếu liên kết với Gemini, Google có thể sẽ thay đổi cuộc chơi.

Phân tích của Ark cho rằng nếu Google kết hợp YouTube Premium và Gemini Pro thành một gói đăng ký duy nhất ( với giá 19.99 đô la mỗi tháng ), điều này sẽ tạo ra áp lực mạnh mẽ lên thị trường.

Các nhà cung cấp AI như OpenAI dựa vào doanh thu từ đăng ký để sinh sống, khó có thể chịu đựng cuộc chiến giá cả, trong khi Google có nhiều nguồn doanh thu từ tìm kiếm, quảng cáo, và điện toán đám mây, có thể mở rộng đáng kể khả năng cạnh tranh ở phía người tiêu dùng thông qua hệ sinh thái nội dung.

Điểm yếu lớn nhất của Google là sự chấp nhận của người dùng, mức độ chấp nhận không bằng ChatGPT.

Mặc dù những tiến bộ kỹ thuật của Google đã được công nhận, Ark cũng thừa nhận rằng điểm yếu lớn nhất của nó vẫn nằm ở phía người dùng. Ark đã trích dẫn dữ liệu thời gian sử dụng ứng dụng tại Mỹ cho thấy, ChatGPT dẫn đầu với 99%, trong khi Gemini chỉ đạt 1%.

Ngay cả khi mở rộng ra thị trường toàn cầu, mức sử dụng của Gemini vẫn tụt hậu đáng kể, không chỉ không theo kịp ChatGPT, mà ngay cả Grok của xAI cũng vượt trội hơn về số phút sử dụng. Ark chỉ ra rằng điều này cho thấy cạnh tranh giữa các nền tảng AI không chỉ phụ thuộc vào khả năng của mô hình, mà còn vào cách tiếp cận sản phẩm, sức mạnh tiếp thị và thói quen của người dùng mới là những yếu tố quyết định tỷ lệ áp dụng lâu dài.

( thực nghiệm: Gemini 3 Nano Banana Pro tự động tạo ra truyện tranh hài hước sau khi suy nghĩ, để Trump trở lại thành người trẻ )

Bài viết này Đầu tư ARK: Google Nano Banana Pro khá xuất sắc, nhưng mức độ áp dụng vẫn không bằng ChatGPT lần đầu xuất hiện trên Chain News ABMedia.

Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
0/400
Không có bình luận
  • Ghim