searchresults
2026-04-27
05:17

GPT-5.5 กลับมาล้ำหน้าในการเขียนโค้ด แต่ OpenAI เปลี่ยนเกณฑ์มาตรฐานหลังแพ้ Opus 4.7

ข่าวประจำเกต 27 เมษายน — SemiAnalysis บริษัทวิเคราะห์เซมิคอนดักเตอร์และ AI ได้เผยแพร่มาตรฐานเปรียบเทียบเชิงเปรียบเทียบของผู้ช่วยการเขียนโค้ด รวมถึง GPT-5.5, Claude Opus 4.7 และ DeepSeek V4 ผลค้นหาที่สำคัญ: GPT-5.5 แสดงถึงการกลับสู่ขอบล้ำในการพัฒนาโมเดลการเขียนโค้ดของ OpenAI เป็นครั้งแรกในรอบหกเดือน โดยวิศวกรของ SemiAnalysis ตอนนี้สลับไปมาระหว่าง Codex และ Claude Code หลังจากก่อนหน้านี้พึ่งพา Claude เกือบทั้งหมด GPT-5.5 อ้างอิงจากแนวทางการพรีเทรนแบบใหม่ที่มีชื่อรหัสว่า "Spud" และถือเป็นการขยายขนาดการพรีเทรนครั้งแรกของ OpenAI นับตั้งแต่ GPT-4.5. ในการทดสอบเชิงปฏิบัติที่ชัดเจน ได้แยกบทบาทออกมาอย่างชัดเจน Claude จัดการการวางแผนโครงการใหม่และการตั้งค่าเริ่มต้น ในขณะที่ Codex โดดเด่นสำหรับการแก้บั๊กที่ต้องใช้การให้เหตุผลหนักๆ Codex แสดงความเข้าใจโครงสร้างข้อมูลและการให้เหตุผลเชิงตรรกะที่แข็งแกร่งกว่า แต่กลับมีปัญหาในการคาดเดาความตั้งใจของผู้ใช้ที่ไม่ชัดเจน ในงานที่คล้ายกันบนแดชบอร์ดเดียว Claude คัดลอกเค้าโครงหน้าจากตัวอย่างได้โดยอัตโนมัติแต่ได้สร้างข้อมูลจำนวนมากขึ้นมา ในขณะที่ Codex ข้ามเรื่องเค้าโครงแต่ให้ข้อมูลที่แม่นยำกว่ามาก การวิเคราะห์เผยรายละเอียดเกี่ยวกับการปรับแต่งเกณฑ์มาตรฐาน: โพสต์บล็อกของ OpenAI ในเดือนกุมภาพันธ์ได้เรียกร้องให้วงการนำ SWE-bench Pro มาเป็นมาตรฐานใหม่สำหรับการประเมินเกณฑ์การเขียนโค้ด อย่างไรก็ตาม การประกาศของ GPT-5.5 ได้เปลี่ยนไปใช้เกณฑ์มาตรฐานใหม่ที่ชื่อ "Expert-SWE" เหตุผล—ซ่อนอยู่ในส่วนปลีกย่อย—คือ GPT-5.5 ถูก Opus 4.7 แซงบน SWE-bench Pro และทำผลงานได้ต่ำกว่ามากเมื่อเทียบกับ Mythos ที่ยังไม่เผยแพร่ของ Anthropic 77.8%. สำหรับ Opus 4.7 Anthropic เผยแพร่การวิเคราะห์สรุปหลังเหตุการณ์ (postmortem) หนึ่งสัปดาห์หลังการเปิดตัว โดยยอมรับบั๊กสามจุดใน Claude Code ที่ยังคงอยู่ต่อเนื่องเป็นเวลาหลายสัปดาห์ตั้งแต่เดือนมีนาคมถึงเมษายน ส่งผลกระทบต่อผู้ใช้งานเกือบทั้งหมด วิศวกรหลายคนเคยรายงานว่าประสิทธิภาพลดลงในเวอร์ชัน 4.6 มาก่อน แต่ถูกมองว่าเป็นข้อสังเกตเชิงอัตวิสัย นอกจากนี้ โทเคไนเซอร์ใหม่ของ Opus 4.7 เพิ่มการใช้งานโทเคนได้สูงถึง 35% ซึ่ง Anthropic ยอมรับอย่างตรงไปตรงมา—ซึ่งเท่ากับเป็นการขึ้นราคาที่ซ่อนอยู่โดยปริยาย DeepSeek V4 ถูกประเมินว่า "ตามทันความก้าวหน้าในระดับแนวหน้าแต่ไม่ได้เป็นผู้นำ" โดยวางตำแหน่งตัวเองเป็นทางเลือกที่มีต้นทุนต่ำที่สุดในบรรดาโมเดลที่ปิดซอร์ส การวิเคราะห์ยังระบุว่า "Claude ยังคงทำผลงานได้ดีกว่า DeepSeek V4 Pro ในงานเขียนภาษาจีนที่มีความยากสูง" โดยแสดงความคิดเห็นว่า "Claude ชนะโมเดลภาษาจีนในภาษาเดียวกับที่มันใช้" บทความนำเสนอแนวคิดสำคัญว่า ควรประเมินราคาของโมเดลด้วย "ต้นทุนต่อหนึ่งงาน" แทนที่จะเป็น "ต้นทุนต่อหนึ่งโทเคน" ราคาของ GPT-5.5 เป็นสองเท่าของ GPT-5.4 input $5, output per million tokens แต่ทำงานเดียวกันได้โดยใช้โทเคนน้อยกว่า ดังนั้นต้นทุนที่แท้จริงจึงไม่ได้จำเป็นต้องสูงขึ้น ข้อมูลเบื้องต้นจาก SemiAnalysis แสดงว่าอัตราส่วนอินพุตต่อเอาต์พุตของ Codex อยู่ที่ 80:1 ต่ำกว่าของ Claude Code ที่ 100:1.
liveNews.More
06:34

OpenAI ปรับเปลี่ยนโมเดลโฆษณาของ ChatGPT ไปใช้แบบ CPC โดยตั้งเป้ารายได้โฆษณา 2.4–2.5 พันล้านดอลลาร์สหรัฐในปี 2026

OpenAI กำลังปรับเปลี่ยนโมเดลโฆษณาของ ChatGPT จากแบบจ่ายตามจำนวนครั้งที่แสดงผล (cost-per-impression) ไปเป็นแบบจ่ายตามจำนวนครั้งที่กดคลิก (cost-per-click) ท่ามกลางแรงกดดันด้านการเงิน แม้จะมีผู้ใช้งาน 900 ล้านคนต่อสัปดาห์ แต่มีเพียง 5% ที่สมัครสมาชิก ส่งผลให้เกิดผลขาดทุน การเปลี่ยนแปลงนี้มีเป้าหมายเพื่อขับเคลื่อนการเติบโตของรายได้จากโฆษณา ขณะเดียวกันก็รักษาความเชื่อมั่นของผู้ใช้ไว้
liveNews.More
10:10

Flare XRP DeFi การเติบโตไม่ดี มีผู้ใช้งานใหม่ต่อวันไม่ถึง 80 คน

Flare Network's XRP DeFi ecosystem has been live for six months, and new user growth has been far below expectations, with an average of only 76 new users per day. The native token FLR has seen a significant price drop since the airdrop in 2023, leading to stagnation in ecosystem development, and facing major challenges in user expansion and asset locks.
liveNews.More
XRP-0.29%
FLR-0.58%
08:50

ระบบเครือข่ายซูเปอร์คอมพิวเตอร์แห่งชาติจีน เพิ่มโควตา Token ฟรีสำหรับผู้ใช้เดี่ยวเป็น 30 ล้าน

BlockBeats News: On March 25th, China's National Supercomputing Internet announced the launch of a new round of Tokens distribution activity. The activity is open to all platform users and offers limited-time free distribution of up to 30 million Tokens per person to lower the experience threshold for scientific research exclusive agents like "Lobster" SClaw. Additionally, National Supercomputing Internet users will enjoy a special renewal price of 0.1 yuan per million Tokens, which will be extended until April 6th.
liveNews.More
15:22

High Stakes Capital ขายโทเค็น HYPE 300,000 枚ภายใน 2 ชั่วโมง มูลค่าประมาณ 11.45 ล้านดอลลาร์สหรัฐ

Gate News Alert: On March 23rd, Onchain Lens monitoring showed that High Stakes Capital sold 300,000 HYPE tokens in the past 2 hours at an average price of $38.17 per token, worth approximately $11.45 million. The address currently still holds 302,421 HYPE tokens (worth approximately $11.54 million), with total profits exceeding $33.2 million.
liveNews.More
HYPE-0.98%
14:01

ทองคำทันทีลดลงมาที่ 4630 ดอลลาร์/ออนซ์ เงินวันนี้ลดลง 3% อัตราผลตอบแทนพันธบัตรสหรัฐฯ เพิ่มขึ้นสูงสุดมาตั้งแต่สิงหาคมปีที่แล้ว

Gate News, on March 20, spot gold declined to touch $4,630 per ounce, down 0.44% intraday; spot silver fell 3.00% intraday, now at $70.56 per ounce. The US 10-year Treasury yield (a key indicator measuring the long-term borrowing costs of the US government) rose to 4.33%, the highest level since August last year.
liveNews.More
10:35

Dormant Bitcoin Whale Moves Funds After 13.5 Years Note: This text is already in English, so it remains unchanged as per your instructions. If you meant to provide Thai text for translation to another language, or if you have other content to translate, please provide it and I'll be happy to help.

ข่าว Gate News จากบอท: วาฬที่ถือ 2,100 BTC ($148M) ได้โอนเงินจำนวนเล็กน้อยไปยังกระเป๋าเงินใหม่หลังจากนอนไม่ขยับมากกว่า 13.5 ปี วาฬนี้ได้รับ 2,100 BTC ครั้งแรกเมื่อ BTC มีราคา $6.59 โดยมีมูลค่ารวม $13,839 ในขณะนั้น
liveNews.More
BTC0.07%
01:39

เครื่องมือการเขียนโปรแกรม AI ของ Cursor ปล่อย Composer 2 Model ที่มีประสิทธิภาพเกิน Opus 4.6 ราคาลดลงเหลือ 14% ของรุ่นก่อนหน้า

Cursor released the third-generation programming model Composer 2 on March 20, with prices significantly reduced to $0.50 per million tokens for input and $2.50 for output, while launching a fast version. Composer 2 outperforms its predecessor in multiple benchmarks but falls short of GPT-5.4, with improvements primarily stemming from continued pre-training of the base model and reinforcement learning. The model is exclusively for Cursor's internal use, and its parent company Anysphere has a valuation of $29.3 billion.
liveNews.More