EMMA: mô hình lái xe tự động cải tiến

32
EMMA, viết tắt của End-to-End Multimodal Model for Autonomous Driving, là một mô hình lái xe tự động dựa trên mô hình ngôn ngữ quy mô lớn đa phương thức. Nó có thể ánh xạ trực tiếp dữ liệu cảm biến máy ảnh thô tới nhiều đầu ra dành riêng cho việc lái xe, chẳng hạn như quỹ đạo dự kiến, vật thể được cảm nhận và các yếu tố bản đồ đường đi. EMMA thể hiện hiệu suất tương đương với các phương pháp tiên tiến trong các nhiệm vụ như lập kế hoạch chuyển động và phát hiện đối tượng 3D, đồng thời đạt được kết quả cạnh tranh trên nhiều điểm chuẩn.