لقد قمت مؤخرًا بتجربة تنافس بين نماذج متعددة، ووجدت شيئًا مثيرًا للاهتمام.


نفس المشكلة في الهيكل، طلبت من كل من Claude و Codex كتابة الحلول بشكل مستقل.
نسى Codex شيئًا واحدًا: استراتيجيتي موزعة على أكثر من 20 عملية مستقلة، والحلول التي يكتبها تفترض "أن جميع المكونات تعمل في مكان واحد"، وهذا غير فعال. بينما لاحظ Claude هذه المشكلة على الفور.
وبالعكس، نسيت Claude شيئًا آخر: فهي مصرة على إنشاء وحدات مستقلة جديدة، رغم أن لدي إطار عمل جاهز يمكنني استخدامه، فقط أحتاج لإضافة حقل واحد. وCodex استعاد هذه النقطة.
الأمر الأكثر إثارة هو الخطوة التالية: طلبت من النموذجين مراجعة الحل النهائي للآخر، وبتلقائية، كلاهما اعتقد أن "الإطار الذي كتبه الآخر جاهز"، ونتيجة لذلك، أغفلوا معًا حالة حافة واحدة — والتي اكتشفتها يدويًا عند تشغيل البيانات الإنتاجية.
لذا، الآن عادةً: في كل جولة من التنافس، أضع معيار نجاح مستقل، وأمنع نموذجًا واحدًا من الاطلاع على مسودات النموذج الآخر. النتيجة هي مسودتان مستقلتان بدون تداخل في المناطق العمياء، وعند جمعهما، نحصل على حل شبه كامل.
شاهد النسخة الأصلية
post-image
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • تثبيت