Alibaba Qwen memperkenalkan model AI terbaru. Ini melampaui solusi dari OpenAI dan DeepSeek

robot
Pembuatan abstrak sedang berlangsung

Alibaba Group's subsidiary, Alibaba Qwen, has introduced a new AI model called Qwen2.5-Max. The organization claims that it outperforms solutions such as GPT-4o, DeepSeek-V3, Llama-3.1-405B, and Claude 3.5 Sonnet in terms of performance.

Menurut rilis resmi, model ini telah dilatih dengan lebih dari 20 triliun token menggunakan metode supervised fine-tuning (SFT) dan reinforcement learning berdasarkan umpan balik (RLHF).

Untuk mengevaluasi kinerja solusi, pengembang menggunakan serangkaian benchmark. Ini termasuk MMLU-Pro, LiveCodeBench, LiveBench, dan Arena-Hard. Hasil evaluasi model AI baru disajikan di bawah ini:

Model baru sudah tersedia di antarmuka Qwen Chat. API solusi dapat digunakan melalui layanan Alibaba Cloud Model Studio.

Perlu dicatat, sebelumnya perusahaan memperkenalkan model lain - Qwen2.5-VL. Itu ditujukan untuk menganalisis teks dan gambar. Itu juga tersedia di Qwen Chat

Qwen2.5-Max tidak lagi memicu reaksi pasar saham dan kripto seperti DeepSeek-R1. Secara khusus, saham NVIDIA tidak bereaksi terhadap peristiwa setelah kejatuhan pada 27 Januari 2025.

Ketika menyiapkan materi ini, mereka melakukan perdagangan seharga $129:

MAX-0.35%
GPT14.53%
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)