理想汽車認為VLA能透過3D和2D視覺的組合
賓士EQE SUV
理想汽車
2D
3D
和
世界
能
和
不
影像
推理
影像
語言
執行
影像
不
視覺
到
人類
2025-05-21 21:00
554
理想認為,VLA能透過3D和2D視覺的組合,完整地看到物理世界,而不像VLM只能解析2D影像。同時,VLA擁有完整的腦系統,具備語言、CoT(思維鏈)推理能力,既能看,也能理解並真正執行動作,符合人類的運作方式。
Prev:Hirain Tecnologías: AR-HUD Tecnología Tendota
Next:Ideal Auto believes that VLA can achieve the goal of combining 3D and 2D vision.
News
Exclusive
Data
Account