Ideal Auto вважає, що VLA може досягти мети поєднання 3D та 2D зору.

2025-05-21 21:00
 554
В ідеалі, VLA мала б змогу бачити фізичний світ у його повноті завдяки поєднанню 3D та 2D зору, на відміну від VLM, яка може інтерпретувати лише 2D-зображення. Водночас, VLA має повноцінну систему мозку з можливостями мови та міркування CoT (ланцюг думок). Він може бачити, розуміти та фактично виконувати дії, що відповідає способу функціонування людей.