Ideal Auto glo dat VLA die doelwit kan bereik om 3D- en 2D-visie te kombineer.

2025-05-21 21:00
 554
Ideaal gesproke sou die VLA die fisiese wêreld in sy geheel kan sien deur 'n kombinasie van 3D- en 2D-visie, anders as die VLM wat slegs 2D-beelde kan interpreteer. Terselfdertyd het VLA 'n volledige breinstelsel met taal- en CoT (gedagteketting) redenasievermoëns. Dit kan sien, verstaan ​​en werklik aksies uitvoer, wat in lyn is met die manier waarop mense funksioneer.