Yuanrong Qixing planlegger å utvikle VLA-modeller basert på NVIDIA Thor-brikker

357
Yuanrong Qixing planlegger å utvikle en VLA-modell (visuell språkhandlingsmodell) basert på NVIDIA Thor-brikker, som forventes å bli offisielt lansert i 2025. VLA-modellen kan koble sammen visjon, språk og handlinger, identifisere og beskrive veimiljøer, trafikkskilt, veideltakere osv., og forstå komplekse interaktive hendelser, skjult semantisk informasjon og logiske resonnementer i trafikkscener.