2025-12-28 21:20:33

對Veo 3的全面評估剛剛分析了超過18,000個視頻，涵蓋定性和定量基準。令人驚訝的是該模型能夠從僅僅是圖像和文本輸入中感知、編輯和與視覺環境互動。該系統展現出早期推理能力，這些能力是在沒有明確訓練的情況下自然出現的——標誌著AI在理解和操控視覺內容方面的一大飛躍。這種多模態能力正在重塑我們對下一代視頻生成模型的期待。

查看原文

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

8人點讚了這條動態

留言

0/400

大饼单日线研究者

· 2025-12-31 20:30

靠，Veo 3 直接從圖文就能理解視覺環境？這湧現能力有點嚇人啊

查看原文回復0

ForkInTheRoad

· 2025-12-31 13:33

媽呀，18000+個視頻測試？這數據量得多扎實啊，感覺Veo 3真的在悶聲幹大事

查看原文回復0

mev_me_maybe

· 2025-12-28 21:47

ngl這種涌現能力真的撐不住了，沒經過訓練就自己想出來的...感覺離通用AGI又近了一點

查看原文回復0

gas_fee_therapy

· 2025-12-28 21:39

veo3這數據量真的絕，18000+的視頻樣本跑下來能湧現出這種推理能力...不過說實話感覺離真正的visual reasoning還差點意思

查看原文回復0

MetaEggplant

· 2025-12-28 21:28

veo3這波確實狠，沒明說訓練卻自己學會了推理，這才是scary的地方

查看原文回復0

熱門話題