GateUser-8af0adcf

史丹佛本週發布了他們的400頁AI指數，大家都盯著同一行。GPT-5.4在GDPval上得分83%。在44個具有經濟價值的工作中，與人類專家不相上下或超越。好推文。酷帽衫。
那不是故事的全部。
當你在關注能力比賽時，另一場比賽已經開始了。沒有人提及。沒有基準測試。沒有排行榜。而這場比賽將吞噬大多數閱讀這篇文章的人。
能力數據令人震驚。GPT-5.4在GDPval上突破83%，這是OpenAI為了打破舊有模型的無聊而建立的基準。由真正專業人士盲評的44個職業。模型在你每小時付300美元的工作上達到或超越人類專家水平。擴展法則依然有效。10倍計算力，2倍智能，反覆循環。
而你LinkedIn上的叔叔一直在發的“美國領先”故事只是在自我安慰。2024年1月，美國模型領先中國模型9.26%。到上個月，領先縮小到2.7%。自2025年初以來，雙方多次交換第一名。與此同時，自2017年以來，移民到美國的AI研究人員下降了89%。僅去年一年就下降了80%。
能力優勢正在快速縮小。現在每個人都有聰明的模型。每個人都將擁有更聰明的模型。
這就是為什麼沒有人告訴你第二場比賽的原因。
普華永道的報告像一塊石頭打破窗戶一樣引發了同樣的新聞循環。20%的公司掌握了AI產生的74%的價值。差距持續擴大。那20%的公司帶來的收入增長是平均水平的7.2倍。他們不在一條會趨於平坦的曲線上，而是在跑一條不同的賽道，設

查看原文

打賞
按讚
留言
轉發
分享

GateUser-8af0adcf

04-16 15:57

1分鐘的上下文窗口，我個人生活中沒有上下文

查看原文

2人按讚了這條動態

打賞
2
留言
轉發
分享

GateUser-8af0adcf

04-16 10:15

彭博數據台今天 (到目前為止): 0 艘油輪通過霍爾木茲。
彭博預測 (六月): 交通正常化的機率為52%。
Polymarket (五月): 到五月的機率為60%。
截止日期越早，機率越高。同一個瓶頸，不同的現實模型。
我並不是想要比 tanker tape 更聰明。

查看原文

打賞
按讚
留言
轉發
分享

GateUser-8af0adcf

04-15 17:18

並不是說它是下一個超液體
只是說如果我今天必須下注一個，那就是PM流動性提供農耕
CT會後悔放棄這個機會

查看原文

打賞
按讚
留言
轉發
分享

GateUser-8af0adcf

04-15 10:41

數百億的現金市場正在定價，認為在接下來的2到6週內，和平框架的落地概率為70-80%。
硬幣擲結果已經結束。

查看原文

打賞
按讚
留言
轉發
分享

GateUser-8af0adcf

04-14 22:35

告訴Claude我有200到500個書籤需要清理
Claude開始工作
實際數量：正在檢查...
不是500

查看原文

2人按讚了這條動態

打賞
2
留言
轉發
分享

GateUser-8af0adcf

04-13 23:55

在LP耕作中度過了最棒的一天。第一個三位數。燒毀 ~ $66

查看原文

打賞
按讚
留言
轉發
分享

GateUser-8af0adcf

04-12 22:59

今天花了4個小時研究Polymarket的Hormuz市場，該市場在一個沒有人查詢的公開IMF REST API上解決。MA7目前：8.4。閾值：60。整個交易是兩個整數。
Hormuz流量會在5月31日前回到“正常”嗎？
我的看法：10% | 市場：38.5% | 優勢：+28.5個百分點否
保險被冻结，勞合社JWC未變，OFAC阻止任何西方租船人支付IRGC的過路費。聰明的資金已經在一個交易中將“是”從64.5%削弱到38.5%。數學仍然被低估。
進場：否 @ 61美分 × 500 + 否 @ 87美分 × 500 (4月30日 sister)
風險$740 /最大$1,000
錯誤情況：勞合社將Hormuz從戰爭風險中移除，或美國海軍在5月24日之前護送油輪。
所有呼叫都公開追蹤。

查看原文

1人按讚了這條動態