Когніція, лабораторія прикладного штучного інтелекту, базована у Сполучених Штатах, представила те, що вона стверджує, є першим у світі програмним інженером на базі ШІ. За словами її творців, агент ШІ на ім’я Девін успішно пройшов практичні інженерні співбесіди, проведені провідними компаніями у галузі ШІ.
Також повідомляється, що Девін виконав реальні завдання, опубліковані на Upwork, американській платформі фрілансу.
«Девін — невтомний, кваліфікований товариш, готовий як разом з вами будувати, так і самостійно виконувати завдання для вашого огляду. З Девіном інженери можуть зосередитися на більш цікавих проблемах, а інженерні команди — прагнути до більш амбітних цілей,» йдеться у офіційному блозі компанії.
Агент ШІ обладнаний передовими можливостями у розробці програмного забезпечення, включаючи кодування, налагодження, розв’язання проблем та інше. Девін використовує алгоритми машинного навчання для постійного навчання та покращення своєї продуктивності, адаптуючись до нових викликів по мірі їх виникнення. Простими словами, Девін може створювати та впроваджувати додатки від початку до кінця, а також тренувати та вдосконалювати свої власні моделі ШІ.
Девін здатен планувати та виконувати складні інженерні завдання, що зазвичай включають тисячі рішень. Ця здатність стала можливою завдяки досягненням Когніції у довгостроковому мисленні та плануванні. За словами компанії, Девін може отримувати релевантний контекст на кожному етапі, навчатися автономно з часом і виправляти помилки за потреби.
На бенчмарку SWE-Bench (бенчмарк для оцінки великих мовних моделей за реальними проблемами програмного забезпечення, знайденими на GitHub), Девін правильно розв’язав 13.86 відсотків проблем без будь-якої допомоги у порівнянні з 1.96 відсотками без допомоги та 4.80 відсотками з допомогою попередніх передових моделей.
Хоча компанія детально описала можливості Девін, деякі експерти висловлюють занепокоєння, що інженер ШІ може зіткнутися з труднощами при виконанні складних вимог або сценаріїв, що залежать від людської інтуїції та креативності. Крім того, інструменти ШІ, такі як Девін, викликають побоювання щодо потенційної втрати робочих місць.
Проте деякі вважають, що Девін може стати цінним партнером для багатьох програмістів, відкриваючи нові можливості для співпраці між людською креативністю та ШІ.
Слідкуйте за нами у Twitter для останніх публікацій та оновлень
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
ПРЕДСТАВЛЯЄМО | Перший у світі AI-інженер-програміст, Девін, виконав реальні проєкти на Upwork
Когніція, лабораторія прикладного штучного інтелекту, базована у Сполучених Штатах, представила те, що вона стверджує, є першим у світі програмним інженером на базі ШІ. За словами її творців, агент ШІ на ім’я Девін успішно пройшов практичні інженерні співбесіди, проведені провідними компаніями у галузі ШІ.
Також повідомляється, що Девін виконав реальні завдання, опубліковані на Upwork, американській платформі фрілансу.
«Девін — невтомний, кваліфікований товариш, готовий як разом з вами будувати, так і самостійно виконувати завдання для вашого огляду. З Девіном інженери можуть зосередитися на більш цікавих проблемах, а інженерні команди — прагнути до більш амбітних цілей,» йдеться у офіційному блозі компанії.
Агент ШІ обладнаний передовими можливостями у розробці програмного забезпечення, включаючи кодування, налагодження, розв’язання проблем та інше. Девін використовує алгоритми машинного навчання для постійного навчання та покращення своєї продуктивності, адаптуючись до нових викликів по мірі їх виникнення. Простими словами, Девін може створювати та впроваджувати додатки від початку до кінця, а також тренувати та вдосконалювати свої власні моделі ШІ.
Девін здатен планувати та виконувати складні інженерні завдання, що зазвичай включають тисячі рішень. Ця здатність стала можливою завдяки досягненням Когніції у довгостроковому мисленні та плануванні. За словами компанії, Девін може отримувати релевантний контекст на кожному етапі, навчатися автономно з часом і виправляти помилки за потреби.
На бенчмарку SWE-Bench (бенчмарк для оцінки великих мовних моделей за реальними проблемами програмного забезпечення, знайденими на GitHub), Девін правильно розв’язав 13.86 відсотків проблем без будь-якої допомоги у порівнянні з 1.96 відсотками без допомоги та 4.80 відсотками з допомогою попередніх передових моделей.
Хоча компанія детально описала можливості Девін, деякі експерти висловлюють занепокоєння, що інженер ШІ може зіткнутися з труднощами при виконанні складних вимог або сценаріїв, що залежать від людської інтуїції та креативності. Крім того, інструменти ШІ, такі як Девін, викликають побоювання щодо потенційної втрати робочих місць.
Проте деякі вважають, що Девін може стати цінним партнером для багатьох програмістів, відкриваючи нові можливості для співпраці між людською креативністю та ШІ.
Слідкуйте за нами у Twitter для останніх публікацій та оновлень