Ideal Auto მიიჩნევს, რომ VLA-ს შეუძლია 3D და 2D ხედვის გაერთიანების მიზნის მიღწევა.

2025-05-21 21:00
 554
იდეალურ შემთხვევაში, VLA-ს შეეძლებოდა ფიზიკური სამყაროს მთლიანად დანახვა 3D და 2D ხედვის კომბინაციით, VLM-ისგან განსხვავებით, რომელსაც მხოლოდ 2D სურათების ინტერპრეტაცია შეუძლია. ამავდროულად, VLA-ს აქვს სრული ტვინის სისტემა ენობრივი და CoT (აზრის ჯაჭვის) მსჯელობის შესაძლებლობებით. მას შეუძლია დაინახოს, გაიგოს და რეალურად შეასრულოს მოქმედებები, რაც შეესაბამება ადამიანების მოქმედების წესს.