Yuanrong Qixing aikoo kehittää NVIDIA Thor -siruihin perustuvia VLA-malleja

2024-12-28 07:38
 357
Yuanrong Qixing aikoo kehittää NVIDIA Thor -siruihin perustuvan VLA-mallin (visual language action model), jonka odotetaan julkaistavan virallisesti vuonna 2025. VLA-malli voi yhdistää näkemyksen, kielen ja toiminnot, tunnistaa ja kuvata tieympäristöjä, liikennemerkkejä, tiellä osallistujia jne. sekä ymmärtää monimutkaisia ​​interaktiivisia tapahtumia, piilotettua semanttista tietoa ja loogista päättelyä liikennenäkymissä.