Alibaba Group's subsidiary, Alibaba Qwen, has introduced a new AI model called Qwen2.5-Max. The organization claims that it outperforms solutions such as GPT-4o, DeepSeek-V3, Llama-3.1-405B, and Claude 3.5 Sonnet in terms of performance.
Menurut rilis resmi, model ini telah dilatih dengan lebih dari 20 triliun token menggunakan metode supervised fine-tuning (SFT) dan reinforcement learning berdasarkan umpan balik (RLHF).
Untuk mengevaluasi kinerja solusi, pengembang menggunakan serangkaian benchmark. Ini termasuk MMLU-Pro, LiveCodeBench, LiveBench, dan Arena-Hard. Hasil evaluasi model AI baru disajikan di bawah ini:
Model baru sudah tersedia di antarmuka Qwen Chat. API solusi dapat digunakan melalui layanan Alibaba Cloud Model Studio.
Perlu dicatat, sebelumnya perusahaan memperkenalkan model lain - Qwen2.5-VL. Itu ditujukan untuk menganalisis teks dan gambar. Itu juga tersedia di Qwen Chat
Qwen2.5-Max tidak lagi memicu reaksi pasar saham dan kripto seperti DeepSeek-R1. Secara khusus, saham NVIDIA tidak bereaksi terhadap peristiwa setelah kejatuhan pada 27 Januari 2025.
Ketika menyiapkan materi ini, mereka melakukan perdagangan seharga $129:
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
Alibaba Qwen memperkenalkan model AI terbaru. Ini melampaui solusi dari OpenAI dan DeepSeek
Alibaba Group's subsidiary, Alibaba Qwen, has introduced a new AI model called Qwen2.5-Max. The organization claims that it outperforms solutions such as GPT-4o, DeepSeek-V3, Llama-3.1-405B, and Claude 3.5 Sonnet in terms of performance.
Menurut rilis resmi, model ini telah dilatih dengan lebih dari 20 triliun token menggunakan metode supervised fine-tuning (SFT) dan reinforcement learning berdasarkan umpan balik (RLHF).
Untuk mengevaluasi kinerja solusi, pengembang menggunakan serangkaian benchmark. Ini termasuk MMLU-Pro, LiveCodeBench, LiveBench, dan Arena-Hard. Hasil evaluasi model AI baru disajikan di bawah ini:
Model baru sudah tersedia di antarmuka Qwen Chat. API solusi dapat digunakan melalui layanan Alibaba Cloud Model Studio.
Perlu dicatat, sebelumnya perusahaan memperkenalkan model lain - Qwen2.5-VL. Itu ditujukan untuk menganalisis teks dan gambar. Itu juga tersedia di Qwen Chat
Qwen2.5-Max tidak lagi memicu reaksi pasar saham dan kripto seperti DeepSeek-R1. Secara khusus, saham NVIDIA tidak bereaksi terhadap peristiwa setelah kejatuhan pada 27 Januari 2025.
Ketika menyiapkan materi ini, mereka melakukan perdagangan seharga $129: