Потратил несколько дней на тестирование OpenAI Codex


Даже при использовании GPT-5.4 xhigh (максимальный уровень рассуждения), основная модель все равно делает много ошибок.
Например, один раз она неправильно поняла инструкцию и удалили то, что не следовало. Еще один случай был еще более абсурдным: она думала, что успешно записала данные, а на самом деле этого не произошло.
Такие ошибки повторялись три раза, и каждый раз Opus обнаруживал их только после проверки.
Мой текущий вывод — Codex очень подходит в качестве инструмента, если дать ему четкое задание по коду, он выполнит его быстро и качественно.
Но чтобы использовать его как основную модель для понимания сложных многошаговых инструкций,判断ировать, стоит ли приступать к делу — пока что не хватает.
Сейчас я все еще делаю основным инструментом Opus 😎
Посмотреть Оригинал
post-image
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить