Китайський техгігант Alibaba оголосив про випуск нової моделі штучного інтелекту Qwen2
Вона розроблена Alibaba Cloud і є наступним поколінням Tongyi Qianwen (Qwen). В неї входять Tongyi Qianwen LLM (або Qwen), Qwen-VL та Qwen-Audio.
Сімейство Qwen2 включає серію з п'яти моделей розміром від 0,5 до 72 млрд параметрів, які навчені з використанням даних з різних галузей на 27 мовах.
Порівняння моделей штучного інтелекту серії Qwen2 від Alibaba. Дані: сайт Qwen.Queen2-72B - найпотужніша модель у серії, навчена на 3 трлн токенів. Для порівняння, показник Llama-2 від Meta складає 2 трлн токенів, Llama-3 - 15 трлн токенів.
Qwen2 може обробляти довгий діалоговий контекст - до 128 000 токенів, що порівнюється з GPT-4o від OpenAI. Команда стверджує, що їхня модель перевершує LLama3 від Meta практично в усіх найважливіших синтетичних тестах.
Порівняння Queen2-72B з конкурентами. Дані: сайт Qwen. Незалежна платформа Elo Arena оцінює Qwen2-72B-Instruct трохи краще, ніж GPT-4-0314, але гірше, ніж Llama3 70B і GPT-4-0125-preview
«Порівняно з сучасними мовними моделями з відкритим вихідним кодом, включаючи раніше випущену Qwen1,5, Qwen2 перевищила більшість моделей і продемонструвала конкурентоздатність в ряді тестів, спрямованих на розуміння мови, генерацію мови, багатомовність, програмування, математику та мислення», — заявила команда Qwen.
Моделі Qwen2 демонструють хороше розуміння довгих контекстів. Qwen2-72B-Instruct може без помилок виконувати завдання з вилучення інформації в будь-якому місці і майже ідеально пройшла тест «Iголка в стог сіна». Часто продуктивність різних моделей починає погіршуватися залежно від взаємодії з нею.
Тест «Іголка в стозі сіна». Дані: сайт Qwen. Раніше Alibaba анонсував випуск чат-бота зі штучним інтелектом Tongyi Qianwen
Нагадаємо, у квітні Meta оголосила про запуск безкоштовного ШІ-асистента Meta AI на платформах WhatsApp, Instagram, Facebook і Messenger. Він створений на основі мовної моделі Llama 3.
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
Alibaba випустила нову модель ШІ Qwen2
Alibaba випустила нову модель ШІ Qwen2
Китайський техгігант Alibaba оголосив про випуск нової моделі штучного інтелекту Qwen2
Вона розроблена Alibaba Cloud і є наступним поколінням Tongyi Qianwen (Qwen). В неї входять Tongyi Qianwen LLM (або Qwen), Qwen-VL та Qwen-Audio.
Сімейство Qwen2 включає серію з п'яти моделей розміром від 0,5 до 72 млрд параметрів, які навчені з використанням даних з різних галузей на 27 мовах.
Порівняння моделей штучного інтелекту серії Qwen2 від Alibaba. Дані: сайт Qwen.Queen2-72B - найпотужніша модель у серії, навчена на 3 трлн токенів. Для порівняння, показник Llama-2 від Meta складає 2 трлн токенів, Llama-3 - 15 трлн токенів.
Qwen2 може обробляти довгий діалоговий контекст - до 128 000 токенів, що порівнюється з GPT-4o від OpenAI. Команда стверджує, що їхня модель перевершує LLama3 від Meta практично в усіх найважливіших синтетичних тестах.
Порівняння Queen2-72B з конкурентами. Дані: сайт Qwen. Незалежна платформа Elo Arena оцінює Qwen2-72B-Instruct трохи краще, ніж GPT-4-0314, але гірше, ніж Llama3 70B і GPT-4-0125-preview
Моделі Qwen2 демонструють хороше розуміння довгих контекстів. Qwen2-72B-Instruct може без помилок виконувати завдання з вилучення інформації в будь-якому місці і майже ідеально пройшла тест «Iголка в стог сіна». Часто продуктивність різних моделей починає погіршуватися залежно від взаємодії з нею.
Тест «Іголка в стозі сіна». Дані: сайт Qwen. Раніше Alibaba анонсував випуск чат-бота зі штучним інтелектом Tongyi Qianwen
Нагадаємо, у квітні Meta оголосила про запуск безкоштовного ШІ-асистента Meta AI на платформах WhatsApp, Instagram, Facebook і Messenger. Він створений на основі мовної моделі Llama 3.