Spoločnosť Ideal Auto verí, že VLA dokáže dosiahnuť cieľ kombinácie 3D a 2D videnia.

554
V ideálnom prípade by VLA dokázala vidieť fyzický svet v jeho celistvosti prostredníctvom kombinácie 3D a 2D videnia, na rozdiel od VLM, ktorý dokáže interpretovať iba 2D obrazy. Zároveň má VLA kompletný mozgový systém s jazykovými a myšlienkovými schopnosťami (CoT). Dokáže vidieť, pochopiť a skutočne vykonávať činnosti, čo je v súlade so spôsobom, akým ľudia fungujú.