OpenAI向左 DeepSeek向右

2026 年 4 月 24 日,DeepSeek V4 預覽版正式發布。

這款包含 1.6 萬億參數的 Pro 版本和 2840 億參數的 Flash 版本的國產大模型,把最核心的賣點砸向了市場,百萬上下文,成了所有官方服務的免費標配。

幾乎同一時間段,大洋彼岸的 OpenAI 也端出了 GPT-5.5。它的算力更龐大,Agent 功能更豐富,但價格也要貴得多。

「百萬上下文」翻譯成大白話,意味着 AI 不再是一條只能記住你前幾句話的「金魚」,而是變成了一個能一口氣吞下三本《三體》、一秒鐘看懂一部兩小時電影、還能順便幫你把錯別字挑出來的「超級大腦」。

舉個最直接的例子,你可以把公司過去三年的所有合同、郵件、財報,一股腦扔給 V4,讓它幫你找出那筆被藏在第 47 頁附件里的違約條款。過去,這件事需要一個律師團隊;現在,它是免費的。

GPT-5.5 把這種超級大腦明碼標價,標準版每百萬輸入 Token 要 5 美元,輸出 30 美元;而面向高階任務的 GPT-5.5 Pro 版本,更是賣到了每百萬輸入 30 美元、輸出 180 美元的天價。

但根據 DeepSeek 官方定價,V4-Flash 緩存命中的輸入每百萬 Token 僅 0.2 元人民幣,輸出 2 元;即便是比肩頂級閉源模型的 V4-Pro,緩存命中輸入為 1 元,緩存未命中輸入為 12 元,而輸出價格僅為 24 元。

大家總以為中美 AI 競爭是模型能力的賽跑,實際上,這早就變成了一場商業模式的分道揚鑣。

OpenAI 曾經是那個高喊「造福全人類」的屠龍少年,現在卻在賣著價格昂貴的精裝商品房;而 DeepSeek,正在用近乎免費的算力,把 AI 變成水電煤。

當 OpenAI 變成精明的包工頭時,DeepSeek 為什麼要不計成本地把頂尖 AI 變成免費的自來水?這場定價權轉移的背後,到底隱藏著怎樣的暗流?

烏蘭察布的冷風

大模型的決勝局,在內蒙古零下 20 度的機房裡。

就在 V4 發布前不久,DeepSeek 的招聘需求裡多了一個讓人意外的崗位:數據中心高級交付經理與高級運維工程師,月薪最高 3 萬,14 薪,駐場內蒙古烏蘭察布。

這是一家曾經標榜「極簡、純粹、只做算法」的輕資產公司。

過去兩年,他們最驕傲的標籤就是「四兩撥千斤」,用不到 600 萬美元的訓練成本,打出了讓美股 AI 板塊暴跌的 DeepSeek-R1。

但 V4 的龐大算力需求,加上美國越來越緊的算力封鎖,徹底打碎了這種輕資產的田園詩。

2025 年,美國商務部進一步收緊了對華 AI 芯片的出口管制,英偉達 H100、H800 已經斷供,就連降級版的 H20 也被拉進了管控名單。這意味着 DeepSeek 未來的算力擴張,必須全面轉向華為昇騰生態。

在 V4 的發布說明中,官方明確表示新模型得到了「華為昇騰加持」,並透露下半年昇騰 950 超節點批量上市後,Pro 的價格還會大幅下調。

這一轉向,不是在程式碼裡改幾行適配層就能完成的,它需要從零開始,在物理層面建立一套完整的國產算力基礎設施。

V4 的萬億參數規模(預訓練數據高達 33 萬億 Token),加上百萬上下文的龐大計算需求,意味着你需要成千上萬張昇騰芯片,需要能容納這些芯片的機房,需要為這些機房供電的電網,需要在零下 20 度的寒風裡維持這些機器不宕機的運維團隊。

梁文鋒把方法論從比特世界打到了原子世界。

算力,最終都要在鋼筋水泥和輸電線裡落地生根。

一邊是穿著格子衫在硅谷敲碼、喝著手沖咖啡的 AI 精英,一邊是裹著軍大衣去內蒙古草原深處守機房的運維人員。這種差異,構成了今天中國 AI 抵抗算力封鎖的底色。

從純算法公司轉型為自建機房的「重資產」玩家,意味着 DeepSeek 告別了「小力出奇跡」的游擊戰時代,正式穿上了重裝步兵的盔甲。

這種轉型的代價是巨大的,修機房、買芯片、拉網線,每一項都是無底洞。更重要的是,這種重資產模式意味着運營成本會呈指數級上升,而 DeepSeek 的商業化收入依然極其有限。

這種定價策略,本質上是在用虧損換生態,用免費換基礎設施的話語權。

一個曾經拒絕所有巨頭、靠量化交易自己掏錢補貼 AI 的硬漢,在這個無底洞面前,還能撐多久?

200 億美元的妥協

4 月,DeepSeek 傳出了啟動首次外部融資的消息,目標估值高達 3000 億人民幣(約 440 億美元),計劃增資 500 億,其中對外募資 300 億。騰訊與阿里爭搶入局的傳聞甚囂塵上。

很多人以為,這是因為建機房太費錢了。但實際上,DeepSeek 融資的核心驅動力,除了買顯卡,更是因為「純粹的技術理想」,在巨頭的人才絞肉機面前,不堪一擊。

在 V4 研發的關鍵衝刺期,國內大廠對 DeepSeek 開啟了瘋狂的定向挖角。从 2025 年下半年至今,DeepSeek 至少 5 名核心研發成員確認離職。第一代模型核心作者王炳宣去了騰訊,V3 核心貢獻者羅福莉被雷軍千萬年薪挖至小米,而 R1 核心作者郭達雅則加盟了字節跳動的 Seed 團隊。

這是市場經濟最赤裸的運作方式,當你的競爭對手手握無限彈藥,而你堅持用自有資金維持運轉時,人才市場就是你最脆弱的軟肋。

你可以要求天才們為了改變世界的理想降薪加班,但當大廠把一張寫著千萬現金和期權的支票拍在桌子上,並許諾無限的算力資源時,理想主義的定價權就不在你手裡了。

梁文鋒的困境,其實是每一個試圖在中國做「慢公司」的創業者都會遇到的困境。在一個大廠能用錢把任何人買走的市場裡,「不融資、不商業化、只做技術」的路線,是極其奢侈的。它的代價,是你必須接受自己的團隊隨時可能被對手用錢清場。

這 3000 億估值的融資,不是梁文鋒對資本的妥協,而是他為了保住 V4 研發陣型,向大廠發起的一場贖人戰爭。他必須坐上資本的牌桌,用同樣的真金白銀,讓留下來的人有足夠的理由繼續留下來。

騰訊與阿里的可能入局,意味着 DeepSeek 從此不再是那個孤獨的、純粹的技術理想主義者。它變成了一家有外部股東、有商業化壓力的公司。這種轉變的代價,是梁文鋒曾經最引以為傲的那種「不受外部壓力干擾的研究自由」,將不可避免地被稀釋。

但他沒有選擇。

當理想主義被迫穿上資本的盔甲,支撐這台龐大機器繼續運轉、支撐烏蘭察布機房日夜轟鳴的底氣,究竟來自哪裡?

另一種「大力出奇跡」

答案不在算法裡,在電網裡。

硅谷現在最焦慮的不是芯片不夠,而是電不夠。馬斯克在田納西州孟菲斯瘋狂建設超級數據中心,OpenAI 甚至開始討論投資核電站,微軟宣布重啟賓夕法尼亞州的三里島核電站來為 AI 數據中心供電。算力的盡頭是電力,這是一個極其冰冷的物理常識。

在美國,一個大型 AI 數據中心的用電量,相當於一座中等城市的日常用電。而美國的電網,是一張建於 20 世紀 50 年代的老舊網絡,擴容緩慢,區域割裂,根本跟不上 AI 時代的算力擴張速度。

而支撐中國 AI 追趕美國的,不僅是那些拿著千萬年薪的算法天才,更是那些默默無聞的特高壓輸電線。

烏蘭察布的數據中心之所以能拔地而起,靠的是內蒙古豐富的綠電,以及中國世界第一的電網調度能力。公開數據顯示,烏蘭察布綠電裝機容量達 1940.2 萬千瓦,佔比約 65.9%,當地低價綠電較東部地區便宜約 50%。再加上年均氣溫僅 4.3℃,自然冷卻期接近 10 個月,能讓設備節能 20% 到 30%。

當 DeepSeek V4 運行時,真正為其輸血的,是中國龐大且極其廉價的電力基礎設施。這是另一種維度的「大力出奇跡」。

這裡有一個極其有趣且殘酷的歷史對照。1986 年,美國用《美日半導體協議》把日本的半導體產業打趴下了,強迫日本開放市場、接受價格管控,日本半導體的全球市場份額從 1986 年的 40% 一路跌到 2011 年的 15%。日本用了三十年都沒能緩過來。

今天,美國試圖用同樣的邏輯鎖死中國 AI,封鎖芯片、限制算力、切斷技術供應鏈。但中國的反擊路徑,和日本完全不同。

日本當年的失敗,在於它的半導體產業高度依賴美國的技術授權和市場准入,一旦被切斷,就失去了獨立生存的能力。而中國 AI 的反擊,是從最底層的物理基礎設施開始重建的,自己造芯片、自己建機房、自己拉電網、自己開源模型。

這是一種極其笨重、極其耗錢、但也極其難以被「絞殺」的路線。當硅谷在雲端修建華麗的巴別塔時,中國在泥土裡挖戰壕。

如果雲端的算力拼殺是一場極其慘烈的重資產消耗戰,除了去內蒙古修機房、拉電線,我們還有沒有逃離雲端霸權的另一條路?

逃離雲端

當硅谷巨頭們把數據中心修得越來越大,甚至像 OpenAI 一樣籌劃著千億美元級別的算力集群時,中國的反擊線,卻悄悄轉移到了地下。

對抗美國算力封鎖的終極武器,其實不是造出比 H100 更強的芯片,而是把大模型塞進每個人的手機裡。

既然我們在雲端機房裡拼不過重火力,那我們就把戰場拉回到 14 億台智能手機和邊緣設備上。這是一種典型的游擊戰打法,而且是一種極難被封鎖的打法,你可以禁止出口高端 GPU,但你沒辦法沒收每個中國人口袋裡的手機。

2026 年,伴隨著 DeepSeek 引發的算力焦慮,中國手機廠商小米、OPPO、vivo 開始了一場瘋狂的「端側轉移」。他們不再滿足於僅僅把手機作為一個調用雲端 API 的顯示器,而是通過極致的模型蒸餾和壓縮,把一個縮小版的超級大腦,硬生生塞進了幾千塊錢的國產手機裡。

這種技術路線的核心,是「蒸餾」。簡單來說,就是用一個超級大模型(老師)去訓練一個小模型(學生),讓小模型學會老師的「思維方式」,而不是死記硬背老師的所有「知識」。

經過極致的蒸餾和量化壓縮,一個原本需要幾百張 GPU 才能跑的大模型,被壓縮到只有 1.2GB 到 2.5GB 大小,在一顆手機芯片上就能流暢運行。

像 MNN Chat 這樣的移動端 AI 應用,已經能讓用戶在手機上本地運行 DeepSeek R1 蒸餾模型。這種端側 AI 的意義在於,你不需要時刻連著 5G 信號,不需要每個月給硅谷巨頭交 100 美元的訂閱費。大模型就在你的口袋裡,斷網也能跑,不用給雲端算力花一分钱。

既然我修不起集中供暖的超級鍋爐房,那我就給每家每戶發一個小火爐。

當然,端側 AI 並不完美。受限於手機芯片的算力和內存,端側模型的能力上限遠不如雲端的超大模型。它能幫你寫一封郵件、翻譯一段文字、總結一篇文章,但如果你想讓它幫你推導一個複雜的數學定理,或者分析一份幾百頁的法律合同,它還是會力不從心。

但這已經足夠了。因為對於絕大多數普通人來說,他們需要的 AI,從來就不是那個能推導數學定理的超級大腦,而是一個能幫他們處理日常瑣事的「貼身助理」。

當大模型變得極其廉價,甚至可以裝進口袋裡時,它將如何改變那些被硅谷遺忘的角落?

全球南方的數字平權

如果你坐在曼哈頓全景玻璃辦公室裡,你大概率會覺得,GPT-5.5 漲價到 100 美元是值得的,因為它能幫你在一秒鐘內寫完一份完美的併購財報。

但如果你站在東非烏干達的一片玉米田裡,面對著因為氣候異常而枯黃的莊稼,100 美元的訂閱費沒人能交得起,因為烏干達的人均月收入不到 150 美元。

硅谷的巨頭們在討論如何用 AI 統治世界,而烏干達的農民和東南亞的窮學生,卻因為 DeepSeek 的開源,第一次走進了數字時代。

GPT-5.5 服務於付得起錢的人,並且它的語料庫幾乎全是英語。如果你用斯瓦希里語或者爪哇語去問它一個問題,它不僅回答得磕磕巴巴,而且消耗的 Token 是英語的幾倍。硅谷巨頭因為「商業回報率低」,主動放棄了這些邊緣市場。

而中國的開源模型,成了全球南方的數字基礎設施。

在烏干達,當地的非政府組織 Sunbird AI,用基於中國開源模型 Qwen 微調出的 Sunflower 系統,把能支持的本地語言從 6 種一舉擴展到了 31 種。這個系統現在被部署在烏干達政府的農業推廣系統裡,用斯瓦希里語給農民發送種植建議。

在馬來西亞,科技公司用開源底座微調出了符合伊斯蘭教法的 AI 模型,不僅支持馬來語和印尼語,還確保輸出內容符合穆斯林市場的宗教與文化標準。从印尼的數字身份系統到肯尼亞的斯瓦希里語醫療問答,中國技術正在滲透進這些國家的社會底層架構。

全球最大 AI 模型 API 聚合平台 OpenRouter 在 2026 年初發布的數據顯示,中國 AI 模型在該平台的 Token 消耗量首次超過美國競爭對手。在某一統計周內,全球前 10 大熱門模型共消耗 8.7 萬億 Token,其中中國模型佔比達到約 61%。

開源打破了美國對 AI 話語權的壟斷,讓資源匱乏的發展中國家跨越了數字鴻溝。這不是什么中美爭霸的宏大敘事,這是 AI 時代真正的「鄉村包圍城市」。

中國的 AI 開源戰略,客觀上正在成為一種極其有效的「軟實力」輸出。當硅谷的巨頭們在雲端築起高牆,試圖成為新時代的數字地主時,那些付不起租金的「技術難民」,終於在開源和端側的泥土裡,找到了屬於自己的火種。

自來水

技術從來就不應該是高高在上的奢侈品。

硅谷造出了極其精美的商品房,門禁森嚴,只對 VIP 開放。但我們修了一條通向千家萬戶的自來水管。

這條水管的起點,在內蒙古零下 20 度的機房裡,在特高壓輸電線的轟鳴中,在 3000 億估值的戰爭裡。它的每一段都沉重、都昂貴、都充滿了被迫與妥協。梁文鋒曾經想做一家純粹的技術公司,但現實逼著他去建機房、去融資、去和大廠搶人。他沒有選擇,因為他選擇了一條更難的路,不把 AI 做成奢侈品,而要把它做成自來水。

而這條水管的終點,在一台幾千塊錢的國產手機上,在烏干達農民粗糙的手指間,在每一個渴望跨越數字鴻溝的普通人生活裡。

算力的圍牆建得再高,也擋不住流向低處的自來水。

此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 留言
  • 轉發
  • 分享
留言
請輸入留言內容
請輸入留言內容
暫無留言