Ideal Auto는 VLA가 3D와 2D 비전을 결합하는 목표를 달성할 수 있다고 믿습니다.

2025-05-21 21:00
 554
이상적으로는 VLA는 2D 이미지만 해석할 수 있는 VLM과 달리 3D와 2D 시각을 결합하여 물리적 세계 전체를 볼 수 있을 것입니다. 동시에 VLA는 언어와 CoT(생각의 사슬) 추론 능력을 갖춘 완전한 뇌 시스템을 갖추고 있습니다. 인간이 작동하는 방식과 일치하여, 보고 이해하고 실제로 행동을 수행할 수 있습니다.