ความสามารถของ Agent ตามทัน Opus4.6 ในราคาเพียง 4%: Arcee เปิดซอร์ส Trinity Large Thinking

BlockBeatNews

อ้างอิงจากการติดตามข่าว 1M AI News บริษัทโมเดล AI ของสหรัฐ Arcee ได้เปิดตัว Trinity-Large-Thinking ซึ่งเป็นโมเดลการอนุมานแบบโอเพนซอร์สสำหรับงานของเอเจนต์ที่ต้องใช้เวลานาน โมเดลนี้ใช้สถาปัตยกรรมแบบ Sparse Mixture of Experts (MoE) มีพารามิเตอร์รวม 400B โดยพารามิเตอร์ที่ถูกเปิดใช้งานมีเพียง 13B และให้ดาวน์โหลดน้ำหนักแบบเปิดผ่าน Hugging Face ภายใต้ใบอนุญาต Apache 2.0

ต่างจาก Trinity-Large-Preview รุ่นก่อนหน้า (การปรับแต่งแบบคำสั่งล้วน) ที่ Trinity-Large-Thinking จะทำการคิดเชิงตรรกะก่อนตอบ มีการเรียกใช้เครื่องมือหลายรอบ ความต่อเนื่องของบริบทที่ยาว และความสามารถในการทำตามคำสั่งได้รับการปรับปรุงขึ้นทั้งหมด เป้าหมายการออกแบบหลักคือการรักษาการแสดงผลที่เสถียรในลูปเอเจนต์ระยะยาว

ในเกณฑ์ความสามารถของเอเจนต์ PinchBench ที่พัฒนาโดย Kilo ทำคะแนนได้ 91.9 อยู่อันดับสอง รองจาก Opus 4.6 ที่ 93.3; ในเกณฑ์งานเอเจนต์ Tau2-Airline ได้ 88.0 ซึ่งสูงที่สุดในบรรดาโมเดลที่เทียบกัน อย่างไรก็ตามประสิทธิภาพในเกณฑ์การอนุมานทั่วไปอยู่ในระดับปานกลาง: GPQA-D ได้ 76.3 ต่ำกว่า Kimi-K2.5 (86.9) และ Opus 4.6 (89.2); MMLU-Pro ได้ 83.4 ซึ่งก็อยู่ท้ายเช่นกัน ตามคำอธิบายอย่างเป็นทางการของ Arcee โมเดลนี้ “ในหลายมิติถือเป็นโมเดลโอเพนซอร์สที่แข็งแกร่งที่สุดนอกประเทศจีน”

Arcee กำหนดราคาสำหรับ API ที่ 0.90 ดอลลาร์สหรัฐ/ล้าน token ตามที่ Arcee ระบุว่าถูกกว่า Opus 4.6 ประมาณ 96% โมเดลได้เปิดให้ใช้งานพร้อมกันบนแพลตฟอร์มการกำหนดเส้นทางโมเดล AI OpenRouter โดยช่วง 5 วันแรกสามารถใช้งานได้ฟรีใน OpenClaw รุ่น Preview ซึ่งเปิดตัวตั้งแต่ปลายเดือนมกราคม ให้บริการใน OpenRouter แล้วมากกว่า 3.37 ล้านล้าน token ถือเป็นโมเดลโอเพนซอร์สที่มีการใช้งานจากสหรัฐอันดับหนึ่งที่ถูกรวบรวมใน OpenClaw และอันดับสี่ของโลก โดย Preview จะยังคงให้บริการฟรีบน OpenRouter ต่อไป

news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น