Anthropic ระบุการเปลี่ยนแปลงระดับผลิตภัณฑ์ 3 รายการที่อยู่เบื้องหลังการลดลงของคุณภาพ Claude Code ไม่ใช่ปัญหาโมเดล

ข้อความข่าวประตู วันที่ 23 เมษายน — ทีมวิศวกรรมของ Anthropic ยืนยันว่า การเสื่อมคุณภาพของ Claude Code ที่ผู้ใช้รายงานในช่วงเดือนที่ผ่านมาเกิดจากการเปลี่ยนแปลงระดับผลิตภัณฑ์จำนวน 3 รายการที่เป็นอิสระกัน ไม่ใช่ปัญหาจาก API หรือโมเดลพื้นฐาน ปัญหา 3 รายการนี้ได้รับการแก้ไขในวันที่ 7 เมษายน 10 เมษายน และ 20 เมษายน ตามลำดับ โดยเวอร์ชันสุดท้ายตอนนี้อยู่ที่ v2.1.116.

การเปลี่ยนแปลงครั้งแรกเกิดขึ้นเมื่อวันที่ 4 มีนาคม เมื่อทีมลดระดับความพยายามในการให้เหตุผลเริ่มต้นของ Claude Code จาก “high” เป็น “medium” เพื่อแก้ไขเหตุการณ์ที่มีความหน่วงอย่างรุนแรงเป็นบางครั้งใน Opus 4.6 ภายใต้ความเข้มของการให้เหตุผลสูง หลังจากได้รับคำร้องเรียนอย่างแพร่หลายเกี่ยวกับประสิทธิภาพที่ลดลง ทีมจึงย้อนกลับการเปลี่ยนแปลงดังกล่าวในวันที่ 7 เมษายน ปัจจุบันค่าเริ่มต้นคือ “xhigh” สำหรับ Opus 4.7 และ “high” สำหรับโมเดลอื่น ๆ

ปัญหาที่สองเป็นบั๊กที่ถูกแนะนำเมื่อวันที่ 26 มีนาคม ระบบได้รับการออกแบบให้ล้างบันทึกการให้เหตุผลเก่าหลังจากที่กิจกรรมการสนทนาไม่มีเกินหนึ่งชั่วโมง เพื่อลดต้นทุนการกู้คืนเซสชัน อย่างไรก็ตาม ข้อบกพร่องในการนำไปใช้งานทำให้การล้างถูกเรียกซ้ำในทุกเทิร์นถัดไปแทนที่จะเกิดเพียงครั้งเดียว ส่งผลให้โมเดลค่อย ๆ สูญเสียบริบทการให้เหตุผลก่อนหน้า ปรากฏออกมาในรูปแบบของความหลงลืมที่เพิ่มขึ้น การดำเนินการซ้ำ และการเรียกใช้เครื่องมือผิดปกติ บั๊กดังกล่าวยังทำให้เกิดการพลาดแคชในทุกคำขอ ซึ่งเร่งการใช้โควตาผู้ใช้ สองการทดลองภายในที่ไม่เกี่ยวข้องกันทำให้เงื่อนไขการทำซ้ำถูกปกปิด ทำให้กระบวนการดีบักยืดเยื้อไปเกินกว่าหนึ่งสัปดาห์ หลังจากแก้ไขในวันที่ 10 เมษายน ทีมได้ตรวจสอบโค้ดที่มีปัญหาโดยใช้ Opus 4.7 และพบว่า Opus 4.7 สามารถระบุบั๊กได้ ขณะที่ Opus 4.6 ทำไม่ได้

การเปลี่ยนแปลงครั้งที่สามเปิดตัวเมื่อวันที่ 16 เมษายน ควบคู่กับ Opus 4.7 ทีมได้เพิ่มคำแนะนำในพรอมต์ของระบบเพื่อลดเอาต์พุตที่ซ้ำซ้อน การทดสอบภายในในช่วงหลายสัปดาห์ไม่พบการถดถอย แต่หลังการเปิดตัวเมื่อมีปฏิสัมพันธ์กับพรอมต์อื่น ๆ คุณภาพการเขียนโค้ดกลับลดลง การประเมินแบบขยายพบว่าประสิทธิภาพลดลง 3% ทั้งใน Opus 4.6 และ 4.7 ส่งผลให้มีการยกเลิกการเปลี่ยนแปลง (rollback) ในวันที่ 20 เมษายน

การเปลี่ยนแปลงทั้งสามครั้งส่งผลกระทบต่อกลุ่มผู้ใช้ที่แตกต่างกันในช่วงเวลาที่ต่างกัน และผลรวมของมันทำให้เกิดการลดลงของคุณภาพที่แพร่หลายและไม่สม่ำเสมอ ซึ่งทำให้การวินิจฉัยซับซ้อนขึ้น Anthropic ระบุว่าจะต้องให้พนักงานภายในมากขึ้นใช้เวอร์ชันบิลด์สาธารณะเดียวกับผู้ใช้ เรียกใช้ชุดการประเมินโมเดลแบบเต็มสำหรับการปรับเปลี่ยนพรอมต์ของระบบทุกครั้ง และนำช่วงการทยอยเปิดตัวแบบเป็นขั้นตอนไปใช้ ในฐานะค่าชดเชย Anthropic ได้รีเซ็ตโควตาการใช้งานสำหรับผู้ใช้สมาชิกทั้งหมดแล้ว

news.article.disclaimer

btc.bar.articles

X (ทวิตเตอร์) เปิดตัวการอัปเกรดแพลตฟอร์มโฆษณาที่ใหญ่ที่สุดในรอบ 20 ปี โดย xAI เข้ามามีส่วนร่วม และการทำโฆษณาเชิงความหมายด้วย AI กลายเป็นแกนหลัก

X ประกาศว่าจะเปิดตัวการรีโนเวตแพลตฟอร์มโฆษณาครั้งใหญ่ที่สุดในรอบ 20 ปี ตั้งแต่เดือนเมษายน 2026 โดยจะสร้างเทคโนโลยีพื้นฐานใหม่และผสานเข้ากับ xAI แพลตฟอร์มใหม่นี้ยึดโฟกัสที่การเพิ่มประสิทธิภาพด้วย AI ปรับปรุงผลลัพธ์ โฆษณาเชิงความหมายและเชิงบริบท เพื่อยกระดับความสะดวกในการใช้งานและการควบคุมการลงโฆษณา เป้าหมายคือทำให้โฆษณากลายเป็นสัญญาณเชิงพาณิชย์ในบริบทแบบเรียลไทม์ และสอดรับกับกลยุทธ์ Everything App เพื่อก้าวขึ้นเป็นเครื่องยนต์ขับเคลื่อนธุรกิจของระบบนิเวศ X

ChainNewsAbmedia2 ชั่วโมง ที่แล้ว

หน่วยงานที่ได้รับการสนับสนุนโดย OpenAI ของ 1X เปิดโรงงานขนาด 58,000 ตารางฟุตในแคลิฟอร์เนีย ตั้งเป้าจะมีหุ่นยนต์ 10,000 ตัวภายในปีแรก

ตามรายงานของ Bloomberg บริษัท 1X Technologies ซึ่งเป็นสตาร์ทอัพด้านหุ่นยนต์ที่ได้รับการสนับสนุนจาก OpenAI ก่อตั้งในนอร์เวย์ ได้เปิดโรงงานผลิตขนาด 58,000 ตารางฟุตในเฮย์เวิร์ด รัฐแคลิฟอร์เนีย โดยมีเป้าหมายที่จะนำในด้านการผลิตหุ่นยนต์มนุษย์แบบฮิวแมนอยด์ระดับสำหรับผู้บริโภคในปริมาณมาก คาดว่าโรงงานดังกล่าวจะผลิตหุ่นยนต์ได้ 10,000 ตัวในส่วน

GateNews4 ชั่วโมง ที่แล้ว

ทำเนียบขาวร่างบันทึกนโยบายด้าน AI สั่งให้หน่วยงานสหรัฐใช้ผู้ให้บริการ AI หลายรายในวันที่ 30 เมษายน

ตามแหล่งข่าวที่ PANews อ้างอิงเมื่อวันที่ 30 เมษายน เจ้าหน้าที่ทำเนียบขาวกำลังร่างบันทึกนโยบายด้านปัญญาประดิษฐ์ฉบับกว้างขวาง ซึ่งสั่งให้หน่วยงานของรัฐบาลสหรัฐฯ ใช้ผู้ให้บริการบริการ AI หลายราย และหลีกเลี่ยงการพึ่งพาเพียงผู้จำหน่ายรายเดียว บันทึกดังกล่าวยังระบุว่าเมื่อบริษัท AI ที่ได้รับการว่าจ้าง

GateNews5 ชั่วโมง ที่แล้ว

หน่วยงานกำกับดูแลไซเบอร์สเปซของจีนเปิดแคมเปญ 4 เดือนเพื่อขจัดความโกลาหลของการประยุกต์ใช้ AI เริ่ม 30 เมษายน

ตามรายงานของ CCTV News สำนักงานบริหารไซเบอร์สเปซของจีนได้เริ่มแคมเปญรณรงค์ทั่วประเทศเป็นเวลา 4 เดือนในวันที่ 30 เมษายน เพื่อรับมือกับความโกลาหลในการประยุกต์ใช้ AI โดยโครงการนี้ถูกปรับใช้ใน 2 ระยะ และมุ่งจัดการปัญหา เช่น การจดทะเบียนโมเดลที่หายไป ความสามารถด้านความปลอดภัยของแพลตฟอร์มและการตรวจทานที่ไม่เพียงพอ

GateNews5 ชั่วโมง ที่แล้ว

Forefront Tech เสร็จสิ้นการกำหนดราคาการเสนอขาย IPO ของ $100M แล้ว เข้าจดทะเบียนใน Nasdaq ภายใต้รหัส FTHAU

ตามรายงานของ ChainCatcher บริษัทจัดหาทุนเพื่อการเข้าซื้อกิจการเฉพาะวัตถุประสงค์ Forefront Tech ได้กำหนดราคาเสนอขายหุ้น IPO มูลค่า 100 ล้านดอลลาร์สหรัฐเสร็จสิ้นเมื่อวันที่ 30 เมษายน และจะเข้าจดทะเบียนใน Nasdaq ภายใต้สัญลักษณ์ FTHAU บริษัทวางแผนจะนำเงินที่ได้ไปใช้แสวงหาโอกาสในการควบรวมกิจการและการเข้าซื้อกิจการในบล็อกเชน, ฟินเทค, ปัญญาประดิษฐ์ และ

GateNews7 ชั่วโมง ที่แล้ว

Anthropic Claude Code เรียกเก็บเงินเกินจากผู้ใช้ 200.98 ดอลลาร์สหรัฐเนื่องจากบั๊กระบบเรียกเก็บเงิน โดยในตอนแรกปฏิเสธการคืนเงินก่อนจะชดเชยเต็มจำนวน

จากการติดตามของ Beating บั๊กด้านการเรียกเก็บเงินในบริการ Claude Code ของ Anthropic ทำให้สมาชิกแบบ Max เกินไปถึง 20x ถูกเรียกเก็บเงินเกิน $200.98 สำหรับค่าธรรมเนียมการใช้งานเพิ่มเติม ทั้งที่ใช้งานเพียง 13% ของโควต้ารายเดือน บั๊กดังกล่าวถูกกระตุ้นเมื่อประวัติ commit ของคลังโค้ด git ของผู้ใช้มีตัวอักษรพิมพ์ใหญ่

GateNews7 ชั่วโมง ที่แล้ว
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น