Yuanrong Qixing planuoja kurti VLA modelius, pagrįstus NVIDIA Thor lustais

2024-12-28 07:38
 357
Yuanrong Qixing planuoja sukurti VLA modelį (vizualinės kalbos veiksmų modelį), pagrįstą NVIDIA Thor lustais, kuris turėtų būti oficialiai pristatytas 2025 m. VLA modelis gali sujungti viziją, kalbą ir veiksmus, identifikuoti ir apibūdinti kelio aplinką, eismo ženklus, kelio dalyvius ir pan., suprasti sudėtingus interaktyvius įvykius, paslėptą semantinę informaciją ir loginius samprotavimus eismo scenose.