GateUser-8af0adcf

vip
幣齡 0.6 年
最高等級 0
用戶暫無簡介
史丹佛本週發布了他們的400頁AI指數,大家都盯著同一行。GPT-5.4在GDPval上得分83%。在44個具有經濟價值的工作中,與人類專家不相上下或超越。好推文。酷帽衫。
那不是故事的全部。
當你在關注能力比賽時,另一場比賽已經開始了。沒有人提及。沒有基準測試。沒有排行榜。而這場比賽將吞噬大多數閱讀這篇文章的人。
能力數據令人震驚。GPT-5.4在GDPval上突破83%,這是OpenAI為了打破舊有模型的無聊而建立的基準。由真正專業人士盲評的44個職業。模型在你每小時付300美元的工作上達到或超越人類專家水平。擴展法則依然有效。10倍計算力,2倍智能,反覆循環。
而你LinkedIn上的叔叔一直在發的“美國領先”故事只是在自我安慰。2024年1月,美國模型領先中國模型9.26%。到上個月,領先縮小到2.7%。自2025年初以來,雙方多次交換第一名。與此同時,自2017年以來,移民到美國的AI研究人員下降了89%。僅去年一年就下降了80%。
能力優勢正在快速縮小。現在每個人都有聰明的模型。每個人都將擁有更聰明的模型。
這就是為什麼沒有人告訴你第二場比賽的原因。
普華永道的報告像一塊石頭打破窗戶一樣引發了同樣的新聞循環。20%的公司掌握了AI產生的74%的價值。差距持續擴大。那20%的公司帶來的收入增長是平均水平的7.2倍。他們不在一條會趨於平坦的曲線上,而是在跑一條不同的賽道,設
查看原文
post-image
  • 打賞
  • 留言
  • 轉發
  • 分享
1分鐘的上下文窗口,我個人生活中沒有上下文
查看原文
post-image
  • 打賞
  • 留言
  • 轉發
  • 分享
彭博數據台今天 (到目前為止): 0 艘油輪通過霍爾木茲。
彭博預測 (六月): 交通正常化的機率為52%。
Polymarket (五月): 到五月的機率為60%。
截止日期越早,機率越高。同一個瓶頸,不同的現實模型。
我並不是想要比 tanker tape 更聰明。
查看原文
post-image
  • 打賞
  • 留言
  • 轉發
  • 分享
並不是說它是下一個超液體
只是說如果我今天必須下注一個,那就是PM流動性提供農耕
CT會後悔放棄這個機會
查看原文
  • 打賞
  • 留言
  • 轉發
  • 分享
數百億的現金市場正在定價,認為在接下來的2到6週內,和平框架的落地概率為70-80%。
硬幣擲結果已經結束。
查看原文
  • 打賞
  • 留言
  • 轉發
  • 分享
告訴Claude我有200到500個書籤需要清理
Claude開始工作
實際數量:正在檢查...
不是500
查看原文
post-image
  • 打賞
  • 留言
  • 轉發
  • 分享
在LP耕作中度過了最棒的一天。第一個三位數。燒毀 ~ $66
查看原文
post-image
  • 打賞
  • 留言
  • 轉發
  • 分享
今天花了4個小時研究Polymarket的Hormuz市場,該市場在一個沒有人查詢的公開IMF REST API上解決。MA7目前:8.4。閾值:60。整個交易是兩個整數。
Hormuz流量會在5月31日前回到“正常”嗎?
我的看法:10% | 市場:38.5% | 優勢:+28.5個百分點 否
保險被冻结,勞合社JWC未變,OFAC阻止任何西方租船人支付IRGC的過路費。聰明的資金已經在一個交易中將“是”從64.5%削弱到38.5%。數學仍然被低估。
進場:否 @ 61美分 × 500 + 否 @ 87美分 × 500 (4月30日 sister)
風險$740 /最大$1,000
錯誤情況:勞合社將Hormuz從戰爭風險中移除,或美國海軍在5月24日之前護送油輪。
所有呼叫都公開追蹤。
查看原文
  • 打賞
  • 留言
  • 轉發
  • 分享
Claude 就像是你從未意識到你需要的人,但又無法想像沒有他的工作伙伴。
查看原文
  • 打賞
  • 留言
  • 轉發
  • 分享
聰明的資金每天支付 $560K 的資金費用來持有倉位
你的藉口是什麼
查看原文
post-image
  • 打賞
  • 留言
  • 轉發
  • 分享
我應該說是的,像這樣的機會並不常有
查看原文
post-image
  • 打賞
  • 留言
  • 轉發
  • 分享
「那可能是我,如果我像猩猩一樣行事,並且把$500K 當作零用錢」
找到一個在伊朗衝突市場上因為沒讀懂決議標準而把$312K 投進去的人。
稍後會有完整的說明。這個市場上我的第一直覺和他完全一樣。不是開玩笑。
查看原文
post-image
  • 打賞
  • 留言
  • 轉發
  • 分享
我們今天在烹飪很酷的東西。包括加密貨幣和專案管理
查看原文
post-image
  • 打賞
  • 留言
  • 轉發
  • 分享
我預先銷售機器人的一致性
查看原文
post-image
  • 打賞
  • 1
  • 轉發
  • 分享
AIBBot量化交易:
太好了
這個月的開始並不算最好,我有幾次 FOMO 進場,但整體來說進展非常順利。
大部分的收益來自我的 Polymarket 基礎設施,而不是純粹的交易技巧。
當你真正知道如何運用代理時,它們是非常厲害的,而不是只靠說你在用它們來刷曝光。
查看原文
  • 打賞
  • 留言
  • 轉發
  • 分享
這太荒謬了。一次提問要 10 美元。
問一下,我們的每日 API 使用上限是多少。
在 sonnet 4.6 上。
到底怎麼回事?
除非你是百萬富翁,否則大家並不會被認為需要用它在 API 上。
就算是那樣也很蠢,因為你可以有一個很好的本地模型,根本不用在意。
查看原文
  • 打賞
  • 留言
  • 轉發
  • 分享
將 OpenClaw 切換到 Gemini 3.1,經過 Anthropic 的變更後
效果真的很好
真的沒想到會這樣
查看原文
  • 打賞
  • 留言
  • 轉發
  • 分享
Anthropic 已確認 OpenClaw 的變更。退款截止日期為4月9日之前。
我理解大家的挫折感,但我不理解仇恨。
OpenClaw 曾是我的研究與分析的得力助手。始終在線、個性鮮明、真正實用。但任何真正重要的內容都要透過 CLI 來完成。那才是真正的輸出所在。
相同的模型、相同的上下文,卻產生完全不同的結果。我的終端機工作流程產生的內容,OpenClaw 甚至都無法接近。
令人驚訝的是,有人用它來運行整個公司的工作流程。還是說這只是一場行銷噱頭?
查看原文
  • 打賞
  • 留言
  • 轉發
  • 分享
這從來不是關於能力
結果我一直在為個性買單
查看原文
  • 打賞
  • 留言
  • 轉發
  • 分享
CT在2017年:開源一切,包括我們的淨資產
CT在2026年:開源是不可避免的
兄弟,我們知道。我們已經捐贈了概念驗證
查看原文
  • 打賞
  • 留言
  • 轉發
  • 分享