Провів кілька днів, тестуючи OpenAI Codex


Навіть при використанні GPT-5.4 xhigh (найвищий рівень розуміння), основна модель все одно робить багато помилок.
Наприклад, одного разу вона неправильно зрозуміла інструкцію і видалила те, що не слід було. Ще один випадок був ще більш абсурдним: вона думала, що успішно записала дані, але насправді цього не сталося.
Те саме трапилося тричі, і кожного разу Opus в кінці переглядав і виявляв помилки.
Мій висновок наразі — Codex дуже підходить як інструмент, якщо давати йому чіткі завдання з кодом, він виконає швидко і якісно.
Але щоб використовувати його як основну модель для розуміння складних багатоступеневих інструкцій, визначення, чи потрібно щось робити — ще не достатньо.
Зараз я все ще орієнтуюся на Opus як основний інструмент 😎
Переглянути оригінал
post-image
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити