Raksasa teknologi Tiongkok Alibaba mengumumkan peluncuran model kecerdasan buatan baru Qwen2
Itu dikembangkan oleh Alibaba Cloud dan merupakan generasi berikutnya dari Tongyi Qianwen (Qwen). Ini termasuk Tongyi Qianwen LLM (atau Qwen), Qwen-VL dan Qwen-Audio.
Keluarga Qwen2 mencakup serangkaian lima model dengan ukuran parameter mulai dari 0,5 hingga 72 miliar, yang dilatih dengan menggunakan data dari berbagai industri dalam 27 bahasa.
Perbandingan model AI seri Qwen2 dari Alibaba. Data: situs Qwen.Queen2-72B - model paling kuat dalam seri, dilatih dengan 3 triliun token. Sebagai perbandingan, Llama-2 dari Meta memiliki 2 triliun token, Llama-3 memiliki 15 triliun token.
Qwen2 dapat memproses konteks dialog panjang hingga 128.000 token, yang sebanding dengan GPT-40 dari OpenAI. Tim mengklaim bahwa model mereka melampaui LLama3 dari Meta dalam hampir semua pengujian sintetis yang paling penting.
Perbandingan Queen2-72B dengan pesaing-pesaingnya. Data: situs Qwen. Platform independen Elo Arena menilai Qwen2-72B-Instruct sedikit lebih baik dari GPT-4-0314, tetapi lebih buruk dari Llama3 70B dan GPT-4-0125-preview.
"Dibandingkan dengan model bahasa terbuka dengan kode sumber yang ada saat ini, termasuk Qwen1,5 yang sebelumnya dirilis, Qwen2 telah melampaui sebagian besar model dan telah menunjukkan daya saing dalam sejumlah tes yang berfokus pada pemahaman bahasa, generasi bahasa, multibahasa, pemrograman, matematika, dan pemikiran", tim Qwen mengatakan.
Model Qwen2 menunjukkan pemahaman yang baik terhadap konteks yang panjang. Qwen2-72B-Instruct dapat melakukan tugas ekstraksi informasi di mana saja tanpa kesalahan dan hampir sempurna melewati tes 'Jarum dalam Jerami'. Seringkali kinerja model yang berbeda mulai menurun seiring interaksi dengan hal itu.
Ingat, pada bulan April Meta mengumumkan peluncuran asisten AI Meta AI gratis di platform WhatsApp, Instagram, Facebook, dan Messenger. Ini dibuat berdasarkan model bahasa Llama 3.
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
Alibaba telah merilis model AI baru Qwen2
Alibaba telah meluncurkan model AI baru Qwen2
Raksasa teknologi Tiongkok Alibaba mengumumkan peluncuran model kecerdasan buatan baru Qwen2
Itu dikembangkan oleh Alibaba Cloud dan merupakan generasi berikutnya dari Tongyi Qianwen (Qwen). Ini termasuk Tongyi Qianwen LLM (atau Qwen), Qwen-VL dan Qwen-Audio.
Keluarga Qwen2 mencakup serangkaian lima model dengan ukuran parameter mulai dari 0,5 hingga 72 miliar, yang dilatih dengan menggunakan data dari berbagai industri dalam 27 bahasa.
Perbandingan model AI seri Qwen2 dari Alibaba. Data: situs Qwen.Queen2-72B - model paling kuat dalam seri, dilatih dengan 3 triliun token. Sebagai perbandingan, Llama-2 dari Meta memiliki 2 triliun token, Llama-3 memiliki 15 triliun token.
Qwen2 dapat memproses konteks dialog panjang hingga 128.000 token, yang sebanding dengan GPT-40 dari OpenAI. Tim mengklaim bahwa model mereka melampaui LLama3 dari Meta dalam hampir semua pengujian sintetis yang paling penting.
Perbandingan Queen2-72B dengan pesaing-pesaingnya. Data: situs Qwen. Platform independen Elo Arena menilai Qwen2-72B-Instruct sedikit lebih baik dari GPT-4-0314, tetapi lebih buruk dari Llama3 70B dan GPT-4-0125-preview.
Model Qwen2 menunjukkan pemahaman yang baik terhadap konteks yang panjang. Qwen2-72B-Instruct dapat melakukan tugas ekstraksi informasi di mana saja tanpa kesalahan dan hampir sempurna melewati tes 'Jarum dalam Jerami'. Seringkali kinerja model yang berbeda mulai menurun seiring interaksi dengan hal itu.
Kuis "Jarum di tumpukan jerami". Sebelumnya, Alibaba mengumumkan penerbitan chatbot kecerdasan buatan Tongyi Qianwen
Ingat, pada bulan April Meta mengumumkan peluncuran asisten AI Meta AI gratis di platform WhatsApp, Instagram, Facebook, dan Messenger. Ini dibuat berdasarkan model bahasa Llama 3.