Alibaba Qwen memperkenalkan model AI terbaru. Ini melampaui solusi dari OpenAI dan DeepSeek

2025-01-29 08:04:46

Pembuatan abstrak sedang berlangsung

Alibaba Group's subsidiary, Alibaba Qwen, has introduced a new AI model called Qwen2.5-Max. The organization claims that it outperforms solutions such as GPT-4o, DeepSeek-V3, Llama-3.1-405B, and Claude 3.5 Sonnet in terms of performance.

Menurut rilis resmi, model ini telah dilatih dengan lebih dari 20 triliun token menggunakan metode supervised fine-tuning (SFT) dan reinforcement learning berdasarkan umpan balik (RLHF).

Untuk mengevaluasi kinerja solusi, pengembang menggunakan serangkaian benchmark. Ini termasuk MMLU-Pro, LiveCodeBench, LiveBench, dan Arena-Hard. Hasil evaluasi model AI baru disajikan di bawah ini:

Model baru sudah tersedia di antarmuka Qwen Chat. API solusi dapat digunakan melalui layanan Alibaba Cloud Model Studio.

Perlu dicatat, sebelumnya perusahaan memperkenalkan model lain - Qwen2.5-VL. Itu ditujukan untuk menganalisis teks dan gambar. Itu juga tersedia di Qwen Chat

Qwen2.5-Max tidak lagi memicu reaksi pasar saham dan kripto seperti DeepSeek-R1. Secara khusus, saham NVIDIA tidak bereaksi terhadap peristiwa setelah kejatuhan pada 27 Januari 2025.

Ketika menyiapkan materi ini, mereka melakukan perdagangan seharga $129:

MAX-0.35%

GPT14.53%

Lihat Asli

Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.

Hadiah
suka
Komentar
Posting ulang
Bagikan

Komentar

0/400

Tidak ada komentar

Topik TrendingLihat Lebih Banyak
#Joingrowthpointsdrawtowiniphone17
12K Popularitas
#Gatelayerofficiallylaunches
4.7M Popularitas
#BtcPriceAnalysis
123.3K Popularitas
#AreYouBullishOrBearishToday?
78K Popularitas
#ShowMyAlphaPoints
164.7K Popularitas

Sematkan

peta situs