對Veo 3的全面評估剛剛分析了超過18,000個視頻,涵蓋定性和定量基準。令人驚訝的是該模型能夠從僅僅是圖像和文本輸入中感知、編輯和與視覺環境互動。該系統展現出早期推理能力,這些能力是在沒有明確訓練的情況下自然出現的——標誌著AI在理解和操控視覺內容方面的一大飛躍。這種多模態能力正在重塑我們對下一代視頻生成模型的期待。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 讚賞
  • 5
  • 轉發
  • 分享
留言
0/400
大饼单日线研究者vip
· 2025-12-31 20:30
靠,Veo 3 直接從圖文就能理解視覺環境?這湧現能力有點嚇人啊
查看原文回復0
ForkInTheRoadvip
· 2025-12-31 13:33
媽呀,18000+個視頻測試?這數據量得多扎實啊,感覺Veo 3真的在悶聲幹大事
查看原文回復0
mev_me_maybevip
· 2025-12-28 21:47
ngl這種涌現能力真的撐不住了,沒經過訓練就自己想出來的...感覺離通用AGI又近了一點
查看原文回復0
gas_fee_therapyvip
· 2025-12-28 21:39
veo3這數據量真的絕,18000+的視頻樣本跑下來能湧現出這種推理能力...不過說實話感覺離真正的visual reasoning還差點意思
查看原文回復0
MetaEggplantvip
· 2025-12-28 21:28
veo3這波確實狠,沒明說訓練卻自己學會了推理,這才是scary的地方
查看原文回復0
交易,隨時隨地
qrCode
掃碼下載 Gate App
社群列表
繁體中文
  • بالعربية
  • Português (Brasil)
  • 简体中文
  • English
  • Español
  • Français (Afrique)
  • Bahasa Indonesia
  • 日本語
  • Português (Portugal)
  • Русский
  • 繁體中文
  • Українська
  • Tiếng Việt