英偉達物理AI推理模型Cosmos-Reason2開源32B旗艦權重

據 動察 Beating 監測,英偉達開放 Cosmos-Reason2-32B 模型權重。Cosmos Reason 2 是英偉達去年底發布的物理 AI 推理視覺語言模型(VLM,同時處理圖像、視頻和文字的模型),專門教機器人和自動駕駛系統理解空間、時間和基礎物理規律。當時只開放了 20 億和 80 億參數兩個小版本的權重,320 億參數的旗艦版直到現在才首次公開。底座是通義千問 Qwen3-VL-32B-Instruct,NVIDIA Open Model License 可商用。

給它一段行車錄像,它能邊看邊推理判斷右轉是否安全;給它一張倉庫照片,它能標出每件貨物的 2D/3D 坐標和邊界框。主要用途三個方向:分析城市和工業場景的視頻流、批量標註傳感器數據、給人形機器人和自動駕駛車輛當規劃大腦。相比上一代,新增目標檢測與時間戳精確定位,上下文窗口擴到 256K token。

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆