Bộ phận của Tập đoàn Alibaba - Alibaba Qwen - vừa giới thiệu một mô hình trí tuệ nhân tạo mới mang tên Qwen2.5-Max. Công ty cho biết mô hình này vượt trội so với các giải pháp như GPT-4o, DeepSeek-V3, Llama-3.1-405B và Claude 3.5 Sonnet theo các chỉ số.
Theo thông báo chính thức, mô hình này đã được đào tạo trên hơn 20 nghìn tỷ mã thông báo bằng phương pháp điều chỉnh tinh chỉnh giám sát (SFT) và được củng cố dựa trên phản hồi (RLHF)
Để đánh giá hiệu suất của giải pháp, các nhà phát triển đã sử dụng một loạt các bài thử nghiệm. Điều này bao gồm MMLU-Pro, LiveCodeBench, LiveBench và Arena-Hard. Kết quả đánh giá của mô hình AI mới được thể hiện dưới đây:
Mẫu mới đã có sẵn trong giao diện Qwen Chat. API của giải pháp có thể được sử dụng thông qua dịch vụ Alibaba Cloud Model Studio.
Lưu ý rằng, trước đó công ty đã giới thiệu một mô hình khác là Qwen2.5-VL. Nó được thiết kế để phân tích văn bản và hình ảnh. Nó cũng có sẵn trong Qwen Chat
Qwen2.5-Max đã không gây ra phản ứng mạnh mẽ nào trên thị trường chứng khoán và tiền điện tử như DeepSeek-R1. Cụ thể, cổ phiếu NVIDIA không phản ứng gì sau sự kiện xảy ra vào ngày 27 tháng 1 năm 2025.
Trong quá trình chuẩn bị tài liệu này, chúng được giao dịch với giá $129:
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Alibaba Qwen đã giới thiệu một mô hình AI mới. Nó vượt trội hơn các giải pháp của OpenAI và DeepSeek.
Bộ phận của Tập đoàn Alibaba - Alibaba Qwen - vừa giới thiệu một mô hình trí tuệ nhân tạo mới mang tên Qwen2.5-Max. Công ty cho biết mô hình này vượt trội so với các giải pháp như GPT-4o, DeepSeek-V3, Llama-3.1-405B và Claude 3.5 Sonnet theo các chỉ số.
Theo thông báo chính thức, mô hình này đã được đào tạo trên hơn 20 nghìn tỷ mã thông báo bằng phương pháp điều chỉnh tinh chỉnh giám sát (SFT) và được củng cố dựa trên phản hồi (RLHF)
Để đánh giá hiệu suất của giải pháp, các nhà phát triển đã sử dụng một loạt các bài thử nghiệm. Điều này bao gồm MMLU-Pro, LiveCodeBench, LiveBench và Arena-Hard. Kết quả đánh giá của mô hình AI mới được thể hiện dưới đây:
Mẫu mới đã có sẵn trong giao diện Qwen Chat. API của giải pháp có thể được sử dụng thông qua dịch vụ Alibaba Cloud Model Studio.
Lưu ý rằng, trước đó công ty đã giới thiệu một mô hình khác là Qwen2.5-VL. Nó được thiết kế để phân tích văn bản và hình ảnh. Nó cũng có sẵn trong Qwen Chat
Qwen2.5-Max đã không gây ra phản ứng mạnh mẽ nào trên thị trường chứng khoán và tiền điện tử như DeepSeek-R1. Cụ thể, cổ phiếu NVIDIA không phản ứng gì sau sự kiện xảy ra vào ngày 27 tháng 1 năm 2025.
Trong quá trình chuẩn bị tài liệu này, chúng được giao dịch với giá $129: