ชื่อบทความต้นฉบับ: The Great GPU Shortage – Rental Capacity – Launching our H100 1 Year Rental Price Index
ผู้เขียนต้นฉบับ: Daniel Nishball、Jordan Nanos、Cheang Kang Wen ฯลฯ
เรียบเรียง: Peggy,BlockBeats
บรรณาธิการ: เมื่อ AI จาก “เครื่องมือ” กำลังก้าวไปสู่ “โครงสร้างพื้นฐานของเวิร์กโฟลว์” ราคาค่าเช่า GPU ก็เข้าสู่ช่วงขาขึ้นอย่างเร่งตัว โดยอุปทานยังคงถูกบีบรัดอย่างต่อเนื่อง
ตั้งแต่ราคาค่าเช่า H100 แบบรายปีที่เพิ่มขึ้นเกือบ 40% ไปจนถึงการล็อกกำลังประมวลผลไว้ล่วงหน้าจนถึงครึ่งหลังของปี 2026 และจากนั้นที่ห้องปฏิบัติการ AI ล็อกอุปทานต่อเนื่องผ่านสัญญาระยะยาวและกลไกการต่ออายุ ตรรรกะการทำงานของตลาด GPU ได้เปลี่ยนไปอย่างชัดเจนแล้ว: ราคาหาไม่ได้ถูกกำหนดเป็นหลักโดยต้นทุนฮาร์ดแวร์อีกต่อไป แต่ถูกหล่อหลอมร่วมกันโดยการใช้ token ความสามารถของโมเดล และประสิทธิภาพการผลิต
ความเปลี่ยนแปลงในฝั่งความต้องการยิ่งสำคัญยิ่งกว่า ระบบหลายเอเจนต์ การสร้างคอนเทนต์แบบกำเนิด (native) เครื่องมือการเขียนโค้ดสำหรับ AI ฯลฯ แนวทางใหม่ ๆ กำลังผลักให้การใช้ token เข้าสู่ช่วงที่เติบโตแบบทวีคูณ การตัดสินหลักของรายงานก็เริ่มชัดเจนขึ้นเรื่อย ๆ เช่นกัน: อัตราส่วนผลตอบแทนต่อการลงทุน (ROI) ของการใช้เครื่องมือ AI ได้ถูกพิสูจน์แล้วว่าให้อัตราผลตอบแทน 5–10 เท่า ทำให้ราคาค่าเช่ากำลังประมวลผลแทบจะเป็นเวลานานยังไม่สามารถสร้างแรงกดดันที่มีประสิทธิผลต่อความต้องการได้
ความตึงตัวที่เกิดขึ้นจึงยิ่งชัดเจนขึ้นเรื่อย ๆ: ในตลาดกำลังประมวลผลจริง ๆ เกิดภาวะขาดแคลนแบบครอบคลุมและอำนาจการกำหนดราคายกตัวขึ้น ขณะที่ตลาดทุนกลับยังยึดติดกับความคาดหวังว่า “ในที่สุดจะล้นเกินและถูกทำให้เป็นสินค้า” ความคลาดเคลื่อนระหว่างความคาดหวังกับความเป็นจริงนี้กำลังปรับโครงสร้างตรรกะของการประเมินมูลค่าในสายงานโครงสร้างพื้นฐานของ AI ใหม่ทั้งหมด
เมื่อกำลังประมวลผลกลายเป็นปัจจัยการผลิตชิ้นใหม่ กลไกด้านราคา โครงสร้างด้านอุปทาน และผลตอบแทนของเงินทุน กำลังอยู่ในกระบวนการปรับโครงสร้างเชิงลึกอีกรอบหนึ่ง
ต่อไปนี้คือข้อความต้นฉบับ:
ความต้องการของ Anthropic’s Claude 4.6 Opus และ Claude Code พุ่งสูงขึ้นอย่างมาก รายได้ประจำต่อปี (ARR) ในเวลาเพียงหนึ่งไตรมาส จากช่วงปลายปีที่แล้วที่ 9 พันล้านดอลลาร์ เพิ่มขึ้นเป็นมากกว่า 25 พันล้านดอลลาร์ในปัจจุบัน เกือบจะเท่ากับการเติบโตเกือบสามเท่า ในขณะเดียวกัน โมเดลโอเพ่นซอร์สที่มีตัวแทนอย่าง GLM และ Kimi K2.5 ก็ยังผลักดันให้เกิดการขยายตัวอย่างรวดเร็วของเคสการใช้งานที่เกี่ยวข้องกับโมเดลโอเพ่นซอร์สเช่นกัน รวมถึงบริษัทต่าง ๆ อย่าง Anthropic, OpenAI และ Neolabs หลายราย ยังคงระดมทุนอย่างต่อเนื่อง ซึ่งก็ยิ่งเร่งความต้องการทรัพยากร GPU
จุดเปลี่ยนนี้หมายความว่า ความต้องการเพิ่มขึ้นอย่างรวดเร็วในช่วงเวลาสั้น ๆ จนเกิดปรากฏการณ์แห่ซื้อ GPU แบบแย่งชิงโดยผู้ให้บริการคลาวด์ขนาดมหึมา (hyperscalers) และผู้ให้บริการคลาวด์หน้าใหม่ (Neoclouds)
ความต้องการที่เพิ่มเข้ามานี้กำลังดันราคาให้สูงขึ้นไปตามห่วงโซ่อุปทานทั้งหมด ตั้งแต่ DRAM และ NAND ไปจนถึงสายไฟเบอร์ออปติก การให้บริการโฮสต์/ดาต้าเซ็นเตอร์ และแม้แต่กังหันก๊าซ ฯลฯ เกือบทุกผลิตภัณฑ์และบริการที่เกี่ยวข้องต่างก็มีราคาปรับขึ้น
ราคาค่าเช่า GPU ได้กลายเป็นหนึ่งในหลายผลิตภัณฑ์และบริการที่เกี่ยวข้องกับกำลังประมวลผล ซึ่งเป็น “พื้นที่” แห่งแรกที่เกิดความตึงตัวด้านอุปทานและราคากระโดดขึ้นอย่างชัดเจนที่สุด สัญญาค่าเช่า GPU แบบ H100 หนึ่งปี ราคาจากจุดต่ำสุดในเดือนตุลาคม 2025 ที่ 1.70 ดอลลาร์ต่อชั่วโมงต่อ GPU เพิ่มขึ้นเป็น 2.35 ดอลลาร์ในเดือนมีนาคม 2026 เพิ่มขึ้นเกือบ 40%
กำลังการเช่า GPU แบบตามต้องการ (on-demand) แทบจะหมดเกลี้ยงในแทบทุกโมเดล—สำหรับผู้ใช้ที่ล็อกอินสแตนซ์แบบตามต้องการไว้แล้ว แม้หลังจากราคาขึ้นแล้วก็ยังไม่ยอมปล่อยกำลังประมวลผลกลับสู่ตลาด ในช่วงต้นปี 2026 ความยากในการหา GPU ก็แทบจะเหมือนพยายามแย่งตั๋วสำหรับ “เที่ยวบินสุดท้าย”: ราคาสูงลิ่ว และแทบไม่มีที่นั่งเหลือ ถ้าจะเปรียบให้ตรงกว่าเดิม แทนที่จะบอกว่าเป็นการแย่งตั๋วเครื่องบิน อาจจะเหมือนกับ “กำลังหาช่องทางไปซื้อยา”
ที่ SemiAnalysis เราติดตามแนวโน้มและประเด็นสำคัญต่าง ๆ ในระบบนิเวศ Neocloud และคลาวด์ขนาดมหึมาอย่างลึกซึ้งมาเป็นเวลานาน ซึ่งรวมถึงราคาค่าเช่า GPU ด้วย ความสามารถนี้มาจากการวิจัยและการปฏิบัติอย่างต่อเนื่องของเราในโปรเจกต์ต่าง ๆ เช่น ClusterMAX、InferenceX และ Total Cost of Ownership (TCO) สำหรับ AI Cloud
ขณะเดียวกัน เราก็ทุ่มเททรัพยากรจำนวนมากเพื่อช่วยเหลือห้องปฏิบัติการ AI ในการเชื่อมต่อกับผู้ให้บริการ Neocloud เพื่อค้นหาทรัพยากรค่าเช่า GPU ในตลาด และยังสื่อสารกับผู้มีส่วนร่วมแทบทั้งหมดในระบบนิเวศอย่างต่อเนื่องเกี่ยวกับแนวโน้มการเปลี่ยนแปลงของราคาค่าเช่า GPU
ตั้งแต่ปี 2023 เป็นต้นมา เราได้สร้างและดูแลชุดระบบดัชนีราคาค่าเช่า GPU ให้กับลูกค้า โดยครอบคลุมโมเดล GPU ยอดนิยม เช่น H100、H200、B200、B300、GB200、GB300、MI300、MI325、MI355 และครอบคลุมระยะเวลาการเช่าที่หลากหลาย ตั้งแต่แบบตามต้องการ (on-demand)、เช่าระยะสั้น 1 เดือน ไปจนถึงสัญญาระยะยาวสูงสุด 5 ปี ดัชนีนี้สร้างจากข้อมูลแบบสำรวจเชิงวิจัยของผู้ให้บริการ Neocloud หลายรายและผู้ซื้อกำลังประมวลผล และทำการตรวจสอบข้ามด้วยข้อมูลจากการซื้อขายจริง รวมถึงสถานการณ์การเจรจาและดีลที่เรามีส่วนร่วมในการจับคู่
วันนี้ เราจะเปิดดัชนีราคาค่าเช่า GPU แบบ H100 หนึ่งปีสู่สาธารณะ โดยหวังจะให้ข้อมูลและมุมมองต่อวงการมากขึ้น ดัชนีนี้อัปเดตรายเดือน และเราจะเผยแพร่การตีความแนวโน้มล่าสุดและการสังเกตตลาดอย่างต่อเนื่องผ่าน X และ LinkedIn สำหรับข้อมูลราคาครบถ้วนที่ครอบคลุมโครงสร้างอายุสัญญาที่แตกต่างกันและโมเดล GPU หลักรุ่นอื่น ๆ ขณะนี้มีให้เฉพาะผู้ใช้งานองค์กรที่สมัครรับโมเดล AI Cloud TCO ของเราเท่านั้น
รายงานฉบับนี้จะเน้นแนวโน้มล่าสุดของตลาดค่าเช่า GPU การสังเกตจากแนวหน้าในตลาด และข้อมูลสำคัญต่าง ๆ โดยอธิบายว่าเรามองโครงสร้างของตลาดโดยรวมอย่างไร และให้การคาดการณ์เบื้องต้นเกี่ยวกับทิศทางของราคาค่าเช่าในอนาคต
เพียงดูจากกราฟราคาค่าเช่า H100 แบบรายปีเท่านั้น ก็ยังไม่เพียงพอที่จะสะท้อนความตึงตัวของตลาดได้อย่างครบถ้วน—จากประสบการณ์จริงของเรากับการเข้าถึงกำลังประมวลผลในแนวหน้า และคำตอบ/ผลสะท้อนจากผู้มีส่วนร่วมในตลาด บ่งชี้ว่าสถานการณ์ยิ่งรุนแรงกว่านั้น
ความต้องการในปัจจุบันมาจากหลายเคสการใช้งานที่มีความแตกต่างสูงจนแทบไม่มี “โซลูชันแบบทั่วไป” ตัวอย่างเช่น ในฝั่งการอินเฟอเรนซ์ โมเดล Mixture of Experts ขนาดใหญ่ (MoE) จะเหมาะกับการรันบนระบบขนาดมหึมารุ่นใหม่อย่าง GB300 NVL72 มากกว่า ขณะที่ฝั่งการเทรน H100 ยังมีความได้เปรียบด้านความคุ้มค่า ทำให้แม้แต่ GPU รุ่น “เก่ากว่า” ค่อนข้างมาก ความต้องการก็ยังคงอยู่ในระดับสูง
ลูกค้าตอนนี้ถึงขั้นแย่งกันจ่ายราคา 14 ดอลลาร์ต่อชั่วโมงต่อ GPU สำหรับ AWS p6-b200 แบบจองล่วงหน้า (抢占式) เพื่อแย่งชิงอินสแตนซ์ บางผู้ให้บริการ Neocloud ชั้นนำก็เลิกขายแบบ single-node ไปแล้ว บางทีราคาต่ออายุสัญญาของ H100 กลับ “เท่ากับ” ตอนที่ทำสัญญากันไว้เมื่อสองหรือสามปีก่อนอย่างสิ้นเชิง และยังมีบางสัญญา H100 ที่ต่ออายุไปถึงปี 2028 โดยระยะเวลาถึง 4 ปี ตอนนี้ถ้าจะหาแม้แต่คลัสเตอร์ H100 หรือ H200 ที่มี 8 น็อด (64 GPU) ก็ไม่ใช่เรื่องง่าย—ในบรรดาผู้ให้บริการที่เราสอบถาม มีครึ่งหนึ่งที่หมดสต็อกไปแล้วโดยสิ้นเชิง ส่วนคำตอบส่วนใหญ่ของผู้ให้บริการคือ: ไม่มี GPU สถาปัตยกรรม Hopper ตัวไหนที่จะครบกำหนดสัญญาและถูกปล่อยออกมาในช่วงระยะเวลาอันใกล้นี้เลย
เรายังได้ยินมาว่า ผู้เช่ากำลังประมวลผลบางรายเริ่มแยกคลัสเตอร์ที่ตนเองเช่าไว้ แล้วนำไปเช่าต่ออีกครั้ง ราวกับการแยกอพาร์ตเมนต์ทำเช่าระยะสั้นในช่วงการแข่งขัน Monaco Grand Prix ต่อจากนี้จะมีสิ่งที่เรียกว่า “Neocloud 二房东 (เจ้าของห้องเช่ารายย่อย)” หรือไม่ คงไม่ใช่แค่เรื่องล้อเล่นอีกต่อไปแล้ว
อุปทานของ Blackwell ก็ยังตึงตัวมากเช่นกัน เราทราบว่าด้วยความต้องการโมเดลน้ำหนักโอเพ่นซอร์สที่แข็งแกร่ง และความต้องการอินเฟอเรนซ์ที่ยังระเบิดอย่างต่อเนื่อง ชุดคลัสเตอร์ Blackwell รุ่นชุดใหม่ที่กำลังจะติดตั้งและส่งมอบ ระยะเวลาจัดส่งได้ยืดออกไปเป็นช่วงตั้งแต่เดือนมิถุนายนถึงเดือนกรกฎาคม และโดยส่วนใหญ่ คลัสเตอร์ที่จะเริ่มใช้งานเหล่านี้ก็ถูกล็อกจองไว้ล่วงหน้าแล้ว จริง ๆ แล้วเมื่อมองทั้งตลาด ตั้งแต่อุปทานที่จะเริ่มเปิดให้ใช้งานใหม่จนถึงเดือนสิงหาคม-กันยายน 2026 เกือบทั้งหมดถูกจองจนเต็มแล้ว
ราคาค่าเช่า GPU: กลับมาร้อนแรงอีกครั้ง
แต่ตลาดทำไมถึงมาถึงขั้นนี้? เพียงแค่ 6 เดือนก่อน ผู้สังเกตการณ์ตลาดส่วนใหญ่ยังตั้งข้อสงสัยเกี่ยวกับ “มูลค่าปลายทาง” ของ GPU และมักมองว่าราคาค่าเช่า GPU จะต้องลดลงอย่างต่อเนื่องไม่ช้าก็เร็วเมื่อเวลาผ่านไป ในตอนนั้น หาก Neocloud หรือผู้ให้บริการคลาวด์ขนาดมหึมาใช้รอบการคิดค่าเสื่อม 6 ปีในการจัดการสินทรัพย์กำลังประมวลผล GPU ในโมเดลการเงิน แม้กระทั่งอาจถูกนักวิเคราะห์การเงินวิจารณ์ แต่ก่อนจะคุยถึงแนวโน้มในอนาคต เรามาทบทวนอย่างรวดเร็วว่ามันเปลี่ยนแปลงมาจนถึงจุดนี้ได้อย่างไร
ก่อนครึ่งหลังของปี 2025 ความคาดหวังหลักของทั้งระบบนิเวศคือ: เมื่อ Blackwell ถูกนำไปใช้งานแบบขนาดใหญ่ และต้นทุนต่อหน่วยกำลังประมวลผลของมันต่ำลงอย่างมีนัยสำคัญ ราคาค่าเช่าของ Hopper (คือ H100 และ H200) จะลดลงอย่างชัดเจน แต่สิ่งที่เกิดขึ้นกลับตรงกันข้าม เมื่อเข้าสู่ครึ่งหลังของปี 2025 ความต้องการของ H100 ไม่เพียงแต่ไม่ได้อ่อนตัวลง แต่กลับเพิ่มขึ้นในหลายสถานการณ์ด้วย สัญญาณเริ่มต้นของคลื่นความต้องการกำลังประมวลผลที่แทบไม่มีที่สิ้นสุดรอบนี้ คือการแพร่กระจายอย่างรวดเร็วของโมเดลน้ำหนักโอเพ่นซอร์ส และการเร่งความเร็วอย่างต่อเนื่องของความต้องการอินเฟอเรนซ์ในช่วงเวลานั้น
เมื่อถึงเดือนมกราคม 2026 ตลาดกำลังประมวลผลก็เข้าสู่จุดเปลี่ยนถัดไป: หลังจากราคาของหน่วยความจำ DRAM และ NAND เพิ่มขึ้นอย่างรวดเร็วในหลายไตรมาส ในที่สุดมันเริ่มเข้าสู่ช่วงที่พุ่งขึ้นแบบเกือบ “โค้งพาราโบลา” ตามข้อมูลของโมเดลพื้นที่จัดเก็บของเรา ในไตรมาสแรกปี 2026 อัตราการเติบโตรายปีของราคา LPDDR5 และ DDR5 ของสัญญา ต่างก็เข้าใกล้ประมาณ 4 เท่าและ 5 เท่าตามลำดับ
เพื่อรับมือกับความเสี่ยงด้านอัตรากำไรจากต้นทุนชิ้นส่วนที่พุ่งขึ้นแบบฉับพลัน OEM เริ่มปรับขึ้นราคาขายเซิร์ฟเวอร์ AI และการปรับขึ้นนั้นสูงกว่าระดับการขึ้นของราคาชิ้นส่วนพื้นฐานอย่างชัดเจน สิ่งนี้ทำให้การตัดสินใจลงทุนด้าน CAPEX ของคลัสเตอร์มีความซับซ้อนขึ้น: ต้นทุนการจัดซื้อเซิร์ฟเวอร์ที่สูงขึ้นทำให้ผลตอบแทนที่คาดหวังของโครงการถูกบีบให้แคบลง ทำให้ผู้ประกอบการบางส่วนชะลอจังหวะการติดตั้ง หรือแม้กระทั่งละทิ้งโครงการไปเลย ส่งผลให้ส่วนของอุปทานใหม่ที่เดิมอาจเริ่ม上线 ถูกเลื่อนออกไปหรือถูกพักไว้ ซึ่งยิ่งทำให้ความตึงตัวในตลาดค่าเช่ารุนแรงขึ้น
ในการ “ชุลมุนการจัดซื้อ” ที่เกิดจาก “การกำหนดราคาของเซิร์ฟเวอร์ AI ที่ควบคุมไม่ได้” ทำให้ความต้องการการเช่า GPU เติบโตขึ้นอย่างชัดเจน ในตลาดเดิมที่เหลือกำลังประมวลผลอยู่แทบจะถูกใช้หมดไปในเดือนมกราคมและกุมภาพันธ์ เมื่อถึงเดือนมีนาคม ไม่ว่าจะเป็น H100、H200 หรือ B200 ก็แทบจะหา “กำลังการผลิตที่พร้อมใช้งาน” ได้แทบไม่ได้ในทุกช่วงอายุสัญญา ราคาค่าเช่าระยะหนึ่งปีทะลุ 2 ดอลลาร์ต่อชั่วโมงต่อ GPU แล้ว ณ ปลายเดือนมกราคม และในช่วงกลางถึงปลายเดือนกุมภาพันธ์ เมื่อเทียบกับปลายเดือนมกราคม ก็เพิ่มขึ้นอีก 15%–20% คาดว่าจะยังเพิ่มขึ้นอีก 15%–20% ในอัตรารายเดือนเทียบต่อเดือนจนถึงสิ้นเดือนมีนาคม
หนึ่งในแรงผลักสำคัญของความต้องการต้นปีนี้มาจากการสร้างคอนเทนต์แบบกำเนิด (native media generation) เช่นแอป Seedance และ Nano Banana กำลังผลักให้ผู้ใช้สร้างและวนซ้ำภาพและวิดีโอในระดับขนาดใหญ่ จึงเพิ่มปริมาณการไหลของ token (token 吞吐量) อย่างเห็นได้ชัด แต่แหล่งความต้องการที่สำคัญและมองเห็นได้ชัดกว่านั้น คือการเกิดขึ้นของเวิร์กโหลดแบบหลายเอเจนต์ (multi-agent)—ระบบเหล่านี้ดำเนินกระบวนการหลายขั้นตอน และในสภาพแวดล้อมที่มีการทำงานแบบความหนาแน่นสูง จะวนซ้ำและพัฒนาอย่างต่อเนื่อง ทำให้การใช้ token และความต้องการกำลังประมวลผลแสดงการเติบโตแบบ “เอ็กซ์โปเนนเชียล”
เทรนด์นี้สะท้อนชัดเป็นพิเศษในข้อมูลที่เกี่ยวกับ Claude Code ซึ่งเราได้กล่าวถึงในหลายบทความก่อนหน้า ยกตัวอย่าง SemiAnalysis เฉพาะใน 7 วันที่ผ่านมาเท่านั้น ภายในบริษัทใช้ token ไปเป็นหลัก “หลายพันล้าน” และต้นทุนเฉลี่ยอยู่ราว 5 ดอลลาร์ต่อหนึ่งล้าน token แต่เวลาและการประหยัดที่เกิดขึ้น รวมถึงการขยายเวิร์กโฟลว์และการเพิ่มขีดความสามารถ กลับมากกว่า “ต้นทุน” เองอย่างมาก ตอนนี้ SemiAnalysis ได้ฝังชุดเครื่องมือ AI ทั้งชุดเข้าไปในหลายเวิร์กโฟลว์ ไม่ได้จำกัดแค่การค้นหาและสรุปผลอย่างง่าย แต่ต่อยอดไปถึงแดชบอร์ดข้อมูล การดึงข้อมูลอัตโนมัติ การประมวลผลข้อมูลขนาดใหญ่ และสถานการณ์อย่างการทำแบบจำลองทางการเงินด้วยเอเจนต์ (agent-based)
เรายังติดตามการระเบิดตัวของความต้องการนี้ผ่านตัวชี้วัดต่าง ๆ เช่นจำนวนการส่งงานประจำวันของ Claude (Claude Commits Daily) ตามแนวโน้มปัจจุบัน เราคาดว่าในช่วงปลายปี 2026 Claude Code จะคิดเป็นมากกว่า 20% ของปริมาณการส่งโค้ดทั้งหมด และพูดได้ว่า ในช่วงเวลาที่คุณยังไม่ทันสังเกต AI ได้เริ่ม “กลืน” กระบวนการพัฒนาซอฟต์แวร์ทั้งกระบวนการแล้ว สำหรับลูกค้าองค์กรที่ต้องการรับชุดข้อมูลนี้ ติดต่อทีม API ของเราได้ แอบบอกไว้ล่วงหน่อยเล็กน้อย: ปริมาณการส่งงานนี้สูงชัดเจนกว่าอัตราที่เราประกาศครั้งแรก
ในวงการของเรา แทบทุกคนล้วนเป็นผู้ใช้ Claude Code แบบหนักมาก แต่เราก็รู้ดีว่าความเป็นจริงของวงการนี้เองก็ฝังตัวอยู่กับ AI และวงการเซมิคอนดักเตอร์อย่างลึกซึ้ง โดยพื้นฐานแล้วเป็นเพียง “คนกลุ่มเล็ก ๆ” ที่อยู่แนวหน้าสุด
สำหรับบริษัทในกลุ่ม Fortune 500 หลายแห่ง และประชาชนในวงกว้างยิ่งกว่า Claude Code และ “โลกของเอเจนต์” ก็เป็นเพียงหัวข้อขอบ ๆ ที่แปลกใหม่เล็กน้อย โดยมักโผล่บ้างในฟีดข่าว Facebook หรือพอดแคสต์ของ NPR พวกเขาแทบยังไม่รู้ตัวว่า คลื่นแห่งความสามารถในการผลิต (productivity) และแรงกระแทกเชิงโครงสร้างที่ขับเคลื่อนโดยเอเจนต์ กำลังจะเข้ามาใกล้แล้ว
เมื่อผู้เล่นจากภาคเศรษฐกิจจริง (real economy) จำนวนมากเริ่มตระหนักทีละขั้นถึงผลตอบแทนการลงทุนที่น่าทึ่งจากการใช้เครื่องมือ AI และเข้ามาร่วม “คลื่นกำลังประมวลผล” นี้ การใช้ token จะยังคงไต่ระดับขึ้นแบบเป็นขั้น ๆ ในประเด็นถกเถียงเรื่องอัตราส่วนผลตอบแทนต่อการลงทุนของ AI นั้น ในความจริงแล้วได้หาข้อสรุปไปแล้ว—คุณค่าที่สร้างจากการใช้เครื่องมือ AI มักจะสูงถึงมากกว่าต้นทุนของมันอย่างน้อยหนึ่งระดับขนาด (order of magnitude) ภายใต้บริบทแบบนี้ การที่เส้นโค้งความต้องการ token ยังคงขยับไปทางขวา กำลังสร้างแรงผลักที่แข็งแกร่งและ (ในระยะปัจจุบัน) ค่อนข้างไร้ความยืดหยุ่น นี่กำลังผลักให้ราคาค่าเช่า GPU ขึ้นต่อเนื่อง
พูดง่าย ๆ คือ หาก ROI ของการใช้เครื่องมือ AI ทำได้ 5–10 เท่า ราคาค่าเช่า GPU ก็ยังมีพื้นที่ขาขึ้นอีกมาก จึงจะสามารถกดดันความต้องการได้อย่างแท้จริง และเราเองก็ไม่ตัดทิ้งว่าการที่ราคาค่าเช่าจะขึ้นต่อ อาจยังคงส่งแรงส่งขึ้นไปยังต้นทุนของเซิร์ฟเวอร์และชิ้นส่วนหลัก (core components)
การเผยแพร่ดัชนีราคาค่าเช่า SemiAnalysis H100 แบบรายปี
วันนี้ เราเปิดให้สาธารณะฟรีสำหรับดัชนีราคาสัญญาค่าเช่า H100 แบบหนึ่งปีของ SemiAnalysis โดยมีเป้าหมายเพื่อเพิ่มการรับรู้และความโปร่งใสในแนวโน้มราคาค่าเช่า GPU
ดัชนีนี้สร้างจากข้อมูลแบบสำรวจรายเดือนของผู้มีส่วนร่วมในตลาดมากกว่า 100 ราย (รวมถึงผู้ให้บริการ Neocloud ผู้ซื้อกำลังประมวลผล และผู้ขาย) เพื่อกำหนดช่วงที่เป็นตัวแทนของราคาค่าเช่า GPU (เปอร์เซ็นไทล์ที่ 25 ถึง 75) นอกจากนี้ เรายังทำการตรวจสอบข้ามด้วยข้อมูลธุรกรรมจริง และในเครือข่ายของเรา เราจับคู่ผู้ซื้อและผู้ขายโดยตรง มีส่วนร่วมในบางดีล เพื่อปรับเทียบระดับราคาต่อไป
ตั้งแต่ปี 2023 เป็นต้นมา เราติดตามสัญญาราคาในช่วงอายุการเช่าตั้งแต่ 3 เดือนถึง 5 ปี สำหรับ GPU รวมถึง H100、H200、B200、B300、GB200、GB300 และยังนำข้อมูลจากกลุ่ม AMD (MI300、MI325、MI355) เข้ามารวมด้วย
เมื่อเทียบกับดัชนี GPU ที่มีอยู่ในตลาดแล้ว ดัชนีราคาสัญญาค่าเช่า H100 แบบหนึ่งปีของ SemiAnalysis มีความแตกต่างสำคัญอยู่หลายประเด็น:
ประการแรก ดัชนีการเช่า GPU จำนวนมากอิงจากการเสนอราคาแบบ spot/on-demand หรือราคาที่ประกาศขายต่อสาธารณะ แต่ในความเป็นจริง การซื้อขายค่าเช่า GPU ส่วนใหญ่ทำผ่านสัญญาระยะยาว โดยปกติจะมีระยะเวลาอย่างน้อย 6 เดือน ราคาเหล่านี้มักถูกกำหนดผ่านการเจรจาระหว่างสองฝ่าย (bilateral negotiation) และไม่ได้ปรากฏในฐานข้อมูลสาธารณะใด ๆ ผู้ให้บริการ Neocloud ขนาดใหญ่จำนวนมากมักนิยมทำสัญญาอย่างน้อย 1 ปี โดย 2–3 ปีจะเป็นตัวเลือกที่พึงประสงค์กว่า และถ้าสามารถบรรลุข้อตกลงแบบเหมาซื้อปริมาณสูง 5 ปีได้ยิ่งดี ดัชนีค่าเช่า H100 แบบหนึ่งปีของ SemiAnalysis จึงโฟกัสไปที่ “ตลาดสัญญา” กลุ่มนี้—กล่าวคือส่วนที่มีปริมาณธุรกรรมเกิดขึ้นจริงหนาแน่นที่สุด ด้วยการชี้ไปที่อายุสัญญาที่เฉพาะเจาะจง ดัชนีนี้ยังทำให้ผู้ใช้ง่ายเข้าใจช่วงตลาดที่ครอบคลุมได้ง่ายขึ้น และสามารถเทียบกับการสังเกตของตนเองเพื่อยืนยันได้
ประการที่สอง ราคาที่เปิดเผยสู่สาธารณะ ไม่ได้สะท้อนราคาที่成交จริง ราคาที่ผู้ให้บริการคลาวด์ขนาดมหึมาและ Neocloud เผยแพร่ มักให้เพียงข้อมูลอ้างอิงเชิงแนวโน้ม ไม่ใช่ระดับการซื้อขายที่แท้จริง ราคาพวกนี้มักล้าหลังจากการเปลี่ยนแปลงในตลาดสัญญา โดยทั่วไปจะมีการปรับหลังจากความต้องหาทางฝั่งกำลังประมวลผลได้เปลี่ยนไปแล้ว โดยเฉพาะในตลาดแบบ on-demand ราคาโดยมากจะถูกกำหนดไว้ค่อนข้างคงที่ และการเปลี่ยนแปลงอุปสงค์จริงจะถูกสะท้อนผ่านอัตราการใช้งาน (utilization) หรือระดับการครอบครองทรัพยากร โดยจะปรับแบบไม่สม่ำเสมอเมื่อจำเป็นเท่านั้น สำหรับกลไกตลาดนี้ บทความด้านล่างจะขยายความต่อไป
ประการที่สาม แม้ว่าจะมีดัชนีจำนวนมากในตลาดที่สามารถประมวลผลข้อมูลการเสนอราคา/ราคา/ธุรกรรมขนาดใหญ่ และมีข้อได้เปรียบด้านการวิเคราะห์แนวโน้ม แต่แนวทางของเราจะเน้นการมีปฏิสัมพันธ์โดยตรงกับผู้เข้าร่วมตลาดมากกว่า ในเบื้องหลังของทุกใบเสนอราคาและทุกดีลมีบริบทและตรรกะการตัดสินใจเฉพาะของมันเอง เราต้องการที่จะนำเสนอข้อมูลเชิงปริมาณพร้อมกับเติมเต็มข้อมูลเชิงคุณภาพและการสังเกตจากแนวหน้า เพื่อสะท้อนโครงสร้างที่แท้จริงของตลาดค่าเช่า GPU ได้ครอบคลุมยิ่งขึ้น
สำหรับผู้ใช้งานองค์กรที่สมัครสมาชิก เราได้ให้ข้อมูลโครงสร้างระยะเวลาครบถ้วน ซึ่งครอบคลุมตลาดค่าเช่า GPU หลักแทบทั้งหมดด้วย
นอกจากการเผยแพร่ดัชนีราคาสัญญาค่าเช่า H100 แบบหนึ่งปีแล้ว เรายังเปิดตัว SemiAnalysis Tokenomics Dashboard สำหรับผู้สมัครสมาชิกโมเดล Tokenomics ระดับองค์กร เพื่อใช้ติดตามและทำความเข้าใจภูมิทัศน์ของโมเดล AI ยุคหน้า แดชบอร์ดนี้รองรับให้ผู้ใช้สร้างการเทียบเคียงแบบกำหนดเองในหลายมิติ เช่น โค้ด การอินเฟอเรนซ์ คณิตศาสตร์ และการประเมินด้วยเอเจนต์ เปรียบเทียบราคาของ API สำหรับโมเดลและผู้ให้บริการที่แตกต่างกัน และดูข้อมูลสำคัญที่ห้องปฏิบัติการ AI ชั้นนำเปิดเผย เช่น ปริมาณการใช้ token รายได้ มูลค่า (valuation) และขนาดลูกค้า เป็นต้น
ก่อนครึ่งหลังของปี 2025 สภาพแวดล้อมด้านการกำหนดราคาของตลาดค่าเช่า GPU ค่อนข้างมีการแข่งขันสูง ในเวลานั้น ผู้ให้บริการยังมีคลัง GPU เพียงพอ ขณะที่ความต้องการจากผู้ใช้ปลายทางเพิ่งเริ่มเร่งความเร็ว ดังนั้น การแข่งขันระหว่างผู้ให้บริการ Neocloud จึงดุเดือด และส่วนใหญ่จะแย่งชิงลูกค้าด้วยราคาที่น่าดึงดูดกว่า เป้าหมายหลักคือการเพิ่มอัตราการใช้งาน (utilization) ให้มากที่สุด และ “รีด” มูลค่าของสินทรัพย์กำลังประมวลผลที่มีอยู่ให้เต็มที่ ก่อนที่รอบการอัปเกรด GPU รอบถัดไปจะมาถึง
แต่หลังจากนั้น ภาพรวมของตลาดพลิกกลับ “180 องศา” ปัจจุบัน Neocloud และผู้ให้บริการคลาวด์ขนาดมหึมาได้ยึดอำนาจไว้ทั้งหมดแล้ว—พวกเขาสามารถเรียกเงินจองล่วงหน้าที่สูงขึ้น ราคาแบบที่ดีกว่า ระยะเวลาสัญญาที่นานขึ้นได้ และแม้กระทั่งเลือกช่วงเวลาที่สัญญาเริ่มต้นและสิ้นสุดเอง เพื่อให้สอดคล้องกับแผนสต็อกและกำลังการผลิตของตนเอง ในขณะเดียวกัน เวลาก็อยู่ฝั่งอุปทาน: พวกเขาสามารถเดินหน้าแผนติดตั้งตามจังหวะของตัวเอง และในสภาพแวดล้อมราคาที่ยังเพิ่มขึ้นอย่างต่อเนื่อง ค่อย ๆ คัดเลือกชุดลูกค้าที่มีคุณภาพที่สุด
ในเชิงโครงสร้าง ตลาดค่าเช่า GPU สามารถแบ่งออกคร่าว ๆ ได้เป็น 3 ส่วนหลัก โดยแต่ละส่วนสอดคล้องกับความต้องการของลูกค้าประเภทต่าง ๆ:
การเช่าระยะสั้น: แบบตามต้องการ (on-demand) แบบแย่งใช้/จองล่วงหน้า (spot) และสัญญาที่มีอายุไม่เกิน 3 เดือน
สัญญาระยะกลาง: สัญญาตั้งแต่ 3 เดือนถึงมากกว่า 3 ปี
การทำสัญญาซื้อขายระยะยาวแบบเหมารวม (offtake): สัญญาระยะ 4–5 ปี โดย 5 ปีเป็นรูปแบบที่พบได้บ่อยที่สุด
การเช่าระยะสั้นอยู่ที่หัวของโครงสร้างอายุสัญญา ในหลายกรณีจะสอดคล้องกับ “กำลังการผลิตที่เหลืออยู่” แต่ก็มีผู้ให้บริการบางส่วน (เช่น Runpod、Lambda) ที่เน้นให้บริการกำลังประมวลผลแบบตามต้องการหรือแบบแย่งใช้/จองล่วงหน้าที่มีขนาดค่อนข้างมากและมีความยืดหยุ่น
ควรสังเกตว่ากลไกการกำหนดราคาของตลาดแบบตามต้องการ แตกต่างอย่างมีนัยสำคัญจากตลาดสัญญาอื่น ๆ โดยปกติ ผู้ให้บริการจะตั้งราคาสำหรับทรัพยากรแบบตามต้องการไว้ในระดับหนึ่งที่ค่อนข้างคงที่ และมีการปรับเพียงในกรณีที่หายากมาก กล่าวอีกนัยหนึ่ง ราคาของตลาดระยะสั้นไม่ได้ถูกขับเคลื่อนโดยอุปสงค์อุปทาน “แบบเรียลไทม์” โดยตรงทั้งหมด แต่สะท้อนความตึงตัวของตลาดผ่านการเปลี่ยนแปลงของอัตราการใช้ทรัพยากรเป็นหลัก
ผู้ให้บริการมักจะปรับราคาแบบครั้งเดียวตามอัตราการใช้ทรัพยากร: เมื่ออัตราการใช้ต่ำ ก็จะลดราคาเพื่อกระตุ้นความต้องการ แต่เมื่ออัตราการใช้เข้าใกล้ระดับเต็มโหลด ก็จะขึ้นราคา เพราะแม้ที่ราคาจะสูงขึ้น ความต้องการก็ยังคงอยู่ในระดับสูง
นี่จึงอธิบายว่า ทำไม เมื่อดูจากลำดับเวลา (time series) ราคาตลาดแบบตามต้องการที่ Neocloud ประกาศ มักจะคงที่เป็นระยะเวลานาน แล้วค่อย “กระโดด” ขึ้นหรือลงแบบกะทันหัน สำหรับตลาดแบบตามต้องการ สิ่งที่สะท้อนการเปลี่ยนแปลงความต้องการอย่างถี่ที่สุด ไม่ใช่ราคา แต่คืออัตราการใช้ทรัพยากร
ที่มา: Lambda Labs、SemiAnalysis
ในแง่เศรษฐศาสตร์ สิ่งที่สำคัญกว่าจริง ๆ คือ “ตลาดสัญญา” เพราะมูลค่าธุรกรรมส่วนใหญ่ของการเช่า GPU เกิดขึ้นในส่วนนี้ โดยสัญญาระยะ 1 ปีนั้นยิ่งสำคัญ—มันสะท้อนทั้งความต้องการแบบเพิ่มขึ้นตามขอบ (marginal demand) ของลูกค้าที่ไม่ใช่ห้องปฏิบัติการ AI และยังสะท้อนความต้องการ “ล้น” จากลูกค้าขนาดใหญ่ ดังนั้นจึงเป็นตัวชี้วัดที่อ่อนไหวที่สุดสำหรับการประเมินว่าตลาดกำลังตึงตัวมากน้อยเพียงใด
บริษัท AI แบบดั้งเดิม (AI Natives) และห้องปฏิบัติการ AI ขนาดเล็กถึงกลาง มีการใช้งานหลักอยู่ในช่วงสัญญา 1–3 ปี อย่างไรก็ตาม แนวโน้มล่าสุดที่เห็นได้ชัดคือ สถาบันเหล่านี้ก็เริ่มพยายามล็อกทรัพยากรกำลังประมวลผลด้วยสัญญาที่ระยะยาวขึ้น หลายแห่งขยายไปถึง 4 ปีขึ้นไป และยังยอมจ่ายเงินจองล่วงหน้าสูงกว่า 20% ซึ่งในสัญญาที่มีอายุเกิน 4 ปีในอดีตไม่ค่อยพบ
ในตลาดระยะยาว 4–5 ปี แรงขับหลักคือห้องปฏิบัติการ AI ขนาดใหญ่ พวกเขาจะล็อกทรัพยากรกำลังประมวลผลขนาดใหญ่ตั้งแต่ช่วงแรก ดีลลักษณะนี้มักเกี่ยวข้องกับคลัสเตอร์ขนาด 50MW, 100MW หรือมากกว่านั้น โดยคร่าว ๆ เท่ากับ GPU GB300 NVL72 ประมาณ 24k ถึง 48k ใบ เมื่อมองภาพรวม โปรโตคอลการทำสัญญาเหมารวมระยะยาวเหล่านี้ได้ครอบครองสัดส่วนที่ค่อนข้างมากในตลาดค่าเช่า GPU ของ Neocloud แล้ว
ห้องปฏิบัติการ AI ชอบสัญญาประเภทนี้ เพราะพวกเขาสามารถล็อกกำลังประมวลผลขนาดใหญ่แบบครั้งเดียว เพื่อรับมือกับความต้องการปลายทางที่เติบโตอย่างรวดเร็ว ในขณะเดียวกัน สถาบันเหล่านี้ยังมีส่วนร่วมอย่างลึกซึ้งในการออกแบบคลัสเตอร์ รวมถึงมิติสำคัญต่าง ๆ เช่น การจัดเก็บ (storage) เครือข่าย (network) และการตั้งค่า CPU ฯลฯ ดีลประเภทนี้มักส่งมอบในรูปแบบ bare metal เพราะห้องปฏิบัติการ AI มีความสามารถด้านวิศวกรรมเพียงพอที่จะปรับแต่งสแต็กเทคโนโลยีลงไปในระดับที่ต่ำกว่า ทำให้สามารถได้ TCO (ต้นทุนรวมในการเป็นเจ้าของ) และประสิทธิภาพที่ดีที่สุด
สำหรับผู้ให้บริการ Neocloud ดีลลักษณะนี้ก็มีความน่าสนใจเช่นกัน ในแง่หนึ่ง พวกเขาสามารถรวมทรัพยากรการขายไปอยู่ที่คำสั่งซื้อขนาดใหญ่จำนวนไม่กี่รายการ โดยไม่ต้องจัดการลูกค้าขนาดเล็กจำนวนมากเพื่อให้ได้รายได้เท่าเดิม ในอีกแง่หนึ่ง สัญญาระยะยาวยังช่วยให้พวกเขาระดมทุนด้วยเงื่อนไขที่ดีกว่าได้—โดยการจับคู่ระยะเวลาการระดมทุนกับอายุสัญญา สามารถลดความเสี่ยงจากการ “ไม่ตรงช่วง” ของระยะเวลา (maturity mismatch) และความเสี่ยงจากความผันผวนด้านราคา และในกรณีส่วนใหญ่ สามารถล็อก IRR ของโครงการไว้ที่ระดับ “เกือบ” สิบกว่าจุดเปอร์เซ็นต์ได้
นอกจากนี้ ผู้ให้บริการคลาวด์ขนาดมหึมา (Hyperscalers) ก็ยังมักทำหน้าที่เป็น “ผู้รับประกัน/ตัวสำรอง” (backstop)—ในฐานะผู้ซื้อโดยตรง พวกเขาจัดซื้อกำลังประมวลผลจาก Neocloud แล้วนำไปขายต่อให้แก่ห้องปฏิบัติการ AI โครงสร้างแบบนี้เป็นผลดีต่อทุกฝ่าย: Neocloud ได้รับเงื่อนไขการเงินที่ดีกว่าโดยอาศัยเครดิตของผู้ซื้อที่มีเรตติ้งระดับ AAA ขณะที่ผู้ให้บริการคลาวด์ขนาดมหึมาไม่จำเป็นต้องขยายงบดุลของตัวเอง แต่ยังสามารถแบ่งส่วนหนึ่งของผลตอบแทนจากโครงการได้ด้วยการให้คำรับรองด้านเครดิต
ตารางด้านล่างแสดงโปรโตคอลการทำสัญญาเหมารวมขนาดใหญ่บางส่วนที่เรากำลังติดตาม เราจะวิเคราะห์ดีลเหล่านี้อย่างลึก เพื่อย้อนกลับหาราคาชั่วโมงกำลังประมวลผลที่แฝงอยู่ ($/hr/GPU) รวมถึงตัวชี้วัดกำไรสำคัญ เช่น IRR ของโครงการ และอัตรากำไร EBIT
ในสภาพแวดล้อมของตลาดปัจจุบัน คลัสเตอร์ AI ขนาดใหญ่ที่กำลังขยายตัวส่วนใหญ่ แท้จริงแล้วถูก “กลืนกินในองค์กร” (internal consumption) โดยห้องปฏิบัติการ AI แต่สถาบันเหล่านี้ยังจะเข้าสู่ตลาดสัญญาภายใน 4 ปีเพื่อเติมกำลังประมวลผล และยังใช้การต่อสัญญาคลัสเตอร์ H100 และ H200 ที่มีอยู่เพื่อ “กัน” ไม่ให้ซัพพลายไหลกลับเข้ามาในตลาดดังกล่าวโดยอ้อม เมื่อ GB200 และคลัสเตอร์ขนาดมหึมา GB300 ค่อย ๆ เริ่ม上线 ความสัมพันธ์ระหว่างอุปสงค์และอุปทานในตลาดสัญญา 1–3 ปี จะกลายเป็นตัวแปรสำคัญที่ควรจับตาในช่วงถัดไป
สิ่งที่น่าจับตามองที่สุดในปัจจุบัน คือความแตกต่างที่เห็นได้ชัดระหว่างความเป็นจริงของฐานรากและอารมณ์ของตลาด แม้ว่าจะสื่อสัญญาณที่ควรเอื้อให้ Neocloud อย่างชัดเจน—คืออุปทานตึงตัวและราคาที่เพิ่มขึ้น (ทำให้อัตรากำไรขยายและอายุการใช้งานของสินทรัพย์ยาวขึ้น)—แต่ตลาดสาธารณะกลับยิ่งมองบริษัทอย่าง CoreWeave、Nebius、Iris Energy ในแง่ที่แย่ลงเรื่อย ๆ ราคาหุ้นของพวกเขายังคงอยู่ที่ระดับต่ำกว่าช่วง 6–12 เดือนที่ผ่านมา
ตลาดยังคงถูกครอบงำด้วยเรื่องเล่า “ในที่สุดจะมีอุปทานส่วนเกินและกำลังประมวลผลจะกลายเป็นสินค้า” และการเปลี่ยนแปลงข้างต้นไม่ได้ช่วยบรรเทาความกังวลของนักลงทุนเกี่ยวกับมูลค่าในระยะยาวของ GPU อย่างแท้จริง แต่จากข้อมูลในแนวหน้า ความตึงตัวของอุปทานและอำนาจการกำหนดราคาที่เพิ่มขึ้น หมายความว่ากำลังประมวลผลเกือบทั้งหมดอยู่ในสถานะที่ถูก “ดูดซับ” โดยความต้องการ—แม้จะมีความแตกต่างด้านประสิทธิภาพ แต่ในสภาพแวดล้อมการขาดแคลนที่รุนแรงเช่นนี้ ยังคงเป็นภาวะอุปทานไม่พอความต้องการ
เพื่อประเมินว่าราคาค่าเช่า GPU จะยังคงอยู่ในระดับสูงต่อไปหรือไม่ ให้เน้นดูตัวแปรสามประการนี้:
1、จังหวะการขยายคลัสเตอร์ GB300 (2026)
หัวใจคือความเร็วสัมพัทธ์ระหว่างการเพิ่มกำลังประมวลผลกับความต้องการ token—เป็นการที่อุปทานเริ่มคลายความตึงตัว หรือความต้องการยังคงแ