Yuanrong Qixing planerar att utveckla VLA-modeller baserade på NVIDIA Thor-chips

357
Yuanrong Qixing planerar att utveckla en VLA-modell (visuell språkhandlingsmodell) baserad på NVIDIA Thor-chips, som förväntas lanseras officiellt 2025. VLA-modellen kan koppla samman vision, språk och handlingar, identifiera och beskriva vägmiljöer, trafikskyltar, vägdeltagare etc. och förstå komplexa interaktiva händelser, dold semantisk information och logiska resonemang i trafikscener.