Les transformateurs de vision mènent la nouvelle révolution de la conduite autonome

756
Le Visual Transformer (ViT) est apparu dans le domaine de la conduite autonome en raison de sa capacité d'apprentissage des fonctionnalités globales et de son mécanisme d'auto-attention. Il peut capturer efficacement les dépendances à longue portée dans les images, permettant aux voitures de prendre des décisions plus précises dans des environnements complexes. L'application de ViT ne se limite pas à la détection et à la reconnaissance de cibles, mais inclut également la planification de trajectoire, la prise de décision de conduite et d'autres aspects, démontrant son grand potentiel dans les systèmes de conduite assistée.