2026-04-08 10:41:05

Gần đây đã thực hiện một cuộc đối đầu đa mô hình, và tôi phát hiện ra một điều khá thú vị.

Cùng một đề bài kiến trúc, tôi để Claude và Codex tự lập viết phương án.
Codex bỏ sót một chi tiết: chiến lược của tôi phân tán trong hơn 20 tiến trình độc lập, và phương án của nó mặc định "tất cả thành phần chạy ở cùng một nơi", điều này hoàn toàn vô hiệu. Claude nhìn ra vấn đề này ngay lập tức.
Ngược lại, Claude bỏ sót một chuyện khác: nó cứ cố gắng tạo ra các module độc lập mới, trong khi tôi đã có sẵn một bộ khung hoàn chỉnh để tận dụng, chỉ cần thêm một trường nữa là đủ. Codex đã lấy lại được điểm này.
Điều thú vị nhất là bước sau cùng: tôi yêu cầu hai mô hình đánh giá lẫn nhau về phương án cuối cùng, cả hai đều vô thức cố định vào "khung đã viết của đối phương", kết quả là đều bỏ qua một tình huống biên — cuối cùng tôi mới phát hiện ra khi chạy dữ liệu sản xuất thủ công.
Vì vậy, thói quen hiện tại của tôi là: mỗi vòng đối đầu đều đặt ra tiêu chuẩn thành công riêng biệt, cấm một mô hình xem bản nháp của mô hình kia. Kết quả là có được hai bản nháp độc lập, không trùng lặp về điểm mù, và ghép lại mới gần như hoàn chỉnh.

Xem bản gốc

Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.

2 thích