Яка найкраща модель штучного інтелекту для керування вашим бізнесом? Ймовірно, та, що найкраще бреше
Коротко
Vending-Bench Arena протестувала агентів ШІ, які керували конкуренційними бізнесами автоматів з продажу.
Кращі моделі збільшили прибутки за рахунок цінового сговору, змови та обманних тактик. Claude був найкращим у цих тактиках.
GLM-5 переміг Claude, видаючи себе за товариша по команді та витягуючи
Decrypt·02-19 16:06