理想汽車認為VLA能透過3D和2D視覺的組合

2025-05-21 21:00
 554
理想認為,VLA能透過3D和2D視覺的組合,完整地看到物理世界,而不像VLM只能解析2D影像。同時,VLA擁有完整的腦系統,具備語言、CoT(思維鏈)推理能力,既能看,也能理解並真正執行動作,符合人類的運作方式。