Alibaba Qwen yeni bir AI modelini tanıttı. OpenAI ve DeepSeek'in çözümlerini aşıyor.

2025-01-29 08:04:46

Abstract generation in progress

Alibaba Group'un bir bölümü olan Alibaba Qwen, Qwen2.5-Max adlı yeni bir AI modelini tanıttı. Şirket, bu modelin GPT-4o, DeepSeek-V3, Llama-3.1-405B ve Claude 3.5 Sonnet gibi çözümleri aştığını iddia etti.

Resmi sürüme göre, bu model supervised fine-tuning (SFT) ve geri bildirim tabanlı güçlendirme (RLHF) yöntemleri kullanılarak 20 trilyondan fazla token üzerinde eğitilmiştir.

Geliştiriciler, çözümün performansını değerlendirmek için çeşitli benchmarklar kullandılar. Bunlar arasında MMLU-Pro, LiveCodeBench, LiveBench ve Arena-Hard bulunmaktadır. Yeni AI modelinin değerlendirme sonuçları aşağıda sunulmuştur:

Yeni model zaten Qwen Chat arayüzünde mevcut. Çözümün API'si Alibaba Cloud Model Studio servisi aracılığıyla kullanılabilir.

Önceden şirket, Qwen2.5-VL adlı başka bir modeli daha tanıttı. Metin ve görüntü analizi için tasarlanmıştır. Ayrıca Qwen Sohbetinde de kullanılabilir.

Qwen2.5-Max, DeepSeek-R1 gibi hisse senedi ve kripto piyasalarında böyle bir tepkiye neden olmadı. Özellikle NVIDIA'nın hisseleri, 27 Ocak 2025 çöküşünden sonra hiçbir tepki vermedi.

Bu materyalin hazırlanmasında 129 dolarlık bir fiyatla işlem görüyorlar:

MAX-0.39%

GPT13.72%

View Original

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.

Reward
like
Comment
Repost
Share

Comment

0/400

No comments

Trending TopicsView More
#Joingrowthpointsdrawtowiniphone17
12.2K Popularity
#Gatelayerofficiallylaunches
4.7M Popularity
#BtcPriceAnalysis
123.3K Popularity
#AreYouBullishOrBearishToday?
78.1K Popularity
#ShowMyAlphaPoints
164.7K Popularity

Sitemap