DeepSeek V4 จะเปิดตัวในไม่กี่สัปดาห์ข้างหน้า และอาจทำงานบนชิปของ Huawei ได้อย่างสมบูรณ์

BlockBeatNews

BlockBeats ข้อความ วันที่ 4 เมษายน ตามรายงานล่าสุดของสื่อเทคโนโลยีสหรัฐฯ The Information ว่า บริษัทสตาร์ทอัพด้าน AI ของจีนอย่าง DeepSeek กำลังจะเปิดตัวโมเดลเรือธงรุ่นใหม่ V4 ซึ่งจะทำงานบนชิปที่ Huawei พัฒนาขึ้นเองทั้งหมด และถูกมองว่าเป็นหมุดหมายสำคัญของจีนในการเร่งกระบวนการทำให้เซมิคอนดักเตอร์พึ่งพาตนเองได้

คาดว่า V4 จะเปิดตัวภายในไม่กี่สัปดาห์ข้างหน้า และจะทำงานบนชิปของ Huawei ทั้งหมด DeepSeek ได้ร่วมมือกับ Huawei และบริษัทออกแบบชิปอย่าง Cambricon มาหลายเดือน เพื่อปรับโค้ดส่วนระดับล่างของโมเดลใหม่อีกครั้ง เพื่อให้รองรับชิปในประเทศได้

นอกจากนี้ สิ่งที่ควรสังเกตคือ DeepSeek ในครั้งนี้ไม่ได้เปิดสิทธิ์การทดสอบล่วงหน้าของ V4 ให้กับ NVIDIA โดยตรง แต่เชิญเฉพาะบริษัทรายทางด้านชิปในประเทศเข้าร่วมในช่วงการปรับปรุงขั้นต้นเท่านั้น ซึ่งถือเป็นการทำลายธรรมเนียมในอุตสาหกรรม

บริษัทเทคโนโลยียักษ์ใหญ่ของจีนอย่าง Alibaba, ByteDance และ Tencent ได้สั่งซื้อชิป Ascend 950PR รุ่นล่าสุดของ Huawei ล่วงหน้าแล้ว ยอดสั่งซื้อรวมมีจำนวนหลายหมื่นชิ้น และมีแผนจะนำไปปรับใช้งานผ่านการติดตั้งบนระบบคลาวด์เพื่อใช้งานกับแอปพลิเคชัน AI ของตนเอง ความต้องการที่พุ่งสูงขึ้นอย่างรวดเร็วทำให้ราคาชิปดังกล่าวปรับขึ้นราว 20%

V4 ใช้สถาปัตยกรรมแบบผู้เชี่ยวชาญแบบผสม (MoE) โดยมีจำนวนพารามิเตอร์รวมประมาณ 1 ล้านล้าน และในการอนุมานแต่ละครั้งจะเปิดใช้งานพารามิเตอร์ราว 37000000000 พารามิเตอร์ สามารถรองรับอินพุตแบบมัลติโหมดทั้งข้อความ รูปภาพ และโค้ด ขณะเดียวกันก็รักษาความหน่วงต่ำได้

ปีที่แล้ว DeepSeek ได้เปิดตัวโมเดลต้นทุนต่ำ V3 และ R1 ซึ่งเคยทำให้หุ้นเทคโนโลยีทั่วโลกดิ่งลงอย่างหนัก จนทำให้ตลาดตั้งคำถามว่า บริษัทรายงาน AI ของสหรัฐฯ จำเป็นต้องทุ่มงบหลายหมื่นล้านดอลลาร์เพื่อจัดหากำลังประมวลผลหรือไม่ ดังนั้น V4 จึงได้รับความสนใจอย่างมากจากนานาชาติ

news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น