Ideal Auto usub, et VLA suudab saavutada 3D- ja 2D-nägemise ühendamise eesmärgi.

2025-05-21 21:00
 554
Ideaalis suudaks VLA näha füüsilist maailma tervikuna 3D- ja 2D-nägemise kombinatsiooni abil, erinevalt VLM-ist, mis suudab tõlgendada ainult 2D-pilte. Samal ajal on VLA-l täielik ajusüsteem, mis sisaldab keele- ja mõtteahela (CoT) arutlusvõimet. See näeb, mõistab ja tegelikult toiminguid sooritab, mis on kooskõlas inimeste toimimisviisiga.