Alibaba Qwen yeni bir AI modelini tanıttı. OpenAI ve DeepSeek'in çözümlerini aşıyor.

robot
Abstract generation in progress

Alibaba Group'un bir bölümü olan Alibaba Qwen, Qwen2.5-Max adlı yeni bir AI modelini tanıttı. Şirket, bu modelin GPT-4o, DeepSeek-V3, Llama-3.1-405B ve Claude 3.5 Sonnet gibi çözümleri aştığını iddia etti.

Resmi sürüme göre, bu model supervised fine-tuning (SFT) ve geri bildirim tabanlı güçlendirme (RLHF) yöntemleri kullanılarak 20 trilyondan fazla token üzerinde eğitilmiştir.

Geliştiriciler, çözümün performansını değerlendirmek için çeşitli benchmarklar kullandılar. Bunlar arasında MMLU-Pro, LiveCodeBench, LiveBench ve Arena-Hard bulunmaktadır. Yeni AI modelinin değerlendirme sonuçları aşağıda sunulmuştur:

Yeni model zaten Qwen Chat arayüzünde mevcut. Çözümün API'si Alibaba Cloud Model Studio servisi aracılığıyla kullanılabilir.

Önceden şirket, Qwen2.5-VL adlı başka bir modeli daha tanıttı. Metin ve görüntü analizi için tasarlanmıştır. Ayrıca Qwen Sohbetinde de kullanılabilir.

Qwen2.5-Max, DeepSeek-R1 gibi hisse senedi ve kripto piyasalarında böyle bir tepkiye neden olmadı. Özellikle NVIDIA'nın hisseleri, 27 Ocak 2025 çöküşünden sonra hiçbir tepki vermedi.

Bu materyalin hazırlanmasında 129 dolarlık bir fiyatla işlem görüyorlar:

MAX-0.39%
GPT13.72%
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • Comment
  • Repost
  • Share
Comment
0/400
No comments
  • Pin
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate App
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)