Ideal Auto uzskata, ka VLA var sasniegt mērķi apvienot 3D un 2D redzi.

2025-05-21 21:00
 554
Ideālā gadījumā VLA spētu redzēt visu fizisko pasauli, apvienojot 3D un 2D redzi, atšķirībā no VLM, kas var interpretēt tikai 2D attēlus. Vienlaikus VLA ir pilnīga smadzeņu sistēma ar valodas un CoT (domu ķēdes) spriešanas spējām. Tas var redzēt, saprast un faktiski veikt darbības, kas atbilst cilvēku darbības veidam.