Ideal Auto beson se VLA mund të arrijë qëllimin e kombinimit të vizionit 3D dhe 2D.

2025-05-21 21:00
 554
Idealisht, VLA do të ishte në gjendje të shihte botën fizike në tërësinë e saj përmes një kombinimi të vizionit 3D dhe 2D, ndryshe nga VLM i cili mund të interpretojë vetëm imazhe 2D. Në të njëjtën kohë, VLA ka një sistem të plotë të trurit me aftësi gjuhësore dhe arsyetimi CoT (zinxhiri i mendimit). Mund të shohë, të kuptojë dhe të kryejë veprime, gjë që është në përputhje me mënyrën se si veprojnë njerëzit.