Ideal Auto yakin bahwa VLA dapat mencapai tujuan menggabungkan penglihatan 3D dan 2D.

2025-05-21 21:00
 554
Idealnya, VLA akan mampu melihat dunia fisik secara keseluruhan melalui kombinasi penglihatan 3D dan 2D, tidak seperti VLM yang hanya dapat menafsirkan gambar 2D. Pada saat yang sama, VLA memiliki sistem otak lengkap dengan kemampuan bahasa dan penalaran CoT (rantai pemikiran). Ia dapat melihat, memahami, dan benar-benar melakukan tindakan, yang sejalan dengan cara manusia beroperasi.