Yuanrong Qixing planlægger at udvikle VLA-modeller baseret på NVIDIA Thor-chips

2024-12-28 07:38
 357
Yuanrong Qixing planlægger at udvikle en VLA-model (visuel sproghandlingsmodel) baseret på NVIDIA Thor-chips, som forventes at blive officielt lanceret i 2025. VLA-modellen kan forbinde vision, sprog og handlinger, identificere og beskrive vejmiljøer, trafikskilte, vejdeltagere osv. og forstå komplekse interaktive hændelser, skjult semantisk information og logiske ræsonnementer i trafikscener.