Какой лучший ИИ-модель для ведения вашего бизнеса? Судя по всему, та, которая лучше всего врет
Кратко
Vending-Bench Arena протестировала ИИ-агентов, управляющих конкурирующими бизнесами автоматов по продаже товаров.
Лучшие модели увеличивали прибыль за счет ценового сговора, сговора и обманных тактик. Claude был лучшим в этих тактиках.
GLM-5 победил Claude, выдавая себя за товарища по команде и извлекая
GLM-2,57%
Decrypt·02-19 16:06