Ideal Auto は、VLA が 3D ビジョンと 2D ビジョンを組み合わせる目標を達成できると考えています。

2025-05-21 21:00
 554
理想的には、VLA は、2D 画像しか解釈できない VLM とは異なり、3D と 2D の視覚の組み合わせを通じて物理的な世界全体を視覚化できるようになります。同時に、VLA は言語と CoT (思考の連鎖) 推論能力を備えた完全な脳システムを持っています。ロボットは、人間の行動と同じように、見て理解し、実際に行動することができます。