Ideal Auto вярва, че VLA може да постигне целта за комбиниране на 3D и 2D зрение.

2025-05-21 21:00
 554
В идеалния случай, VLA би могла да вижда физическия свят в неговата цялост чрез комбинация от 3D и 2D зрение, за разлика от VLM, която може да интерпретира само 2D изображения. В същото време, VLA има цялостна мозъчна система с езикови и CoT (верига от мисли) възможности за разсъждение. То може да вижда, разбира и реално да извършва действия, което е в съответствие с начина, по който хората функционират.