EMMA: um modelo inovador de condução autônoma

32
EMMA, que significa End-to-End Multimodal Model for Autonomous Driving, é um modelo de condução autônoma baseado em um modelo de linguagem multimodal em grande escala. Ele pode mapear diretamente os dados brutos do sensor da câmera para uma variedade de resultados específicos de direção, como trajetórias planejadas, objetos detectados e elementos de mapas rodoviários. O EMMA demonstra desempenho comparável aos métodos mais modernos em tarefas como planejamento de movimento e detecção de objetos 3D, e alcança resultados competitivos em vários benchmarks.