Ứng dụng mô hình ngôn ngữ hình ảnh trong lái xe tự động-Redplanx

Là một công nghệ trí tuệ nhân tạo mới, mô hình ngôn ngữ hình ảnh (VLM) đang thay đổi luật chơi trong ngành công nghiệp xe tự lái. Mô hình này có thể hiểu và giải thích thông tin hình ảnh và văn bản, cho phép chiếc xe hiểu rõ hơn về môi trường xung quanh và đưa ra quyết định. Ví dụ, VLM có thể giúp các phương tiện nhận biết biển báo giao thông và vạch kẻ đường, hiểu ý định của người đi bộ và các phương tiện khác và thậm chí dự đoán hành vi của những người lái xe khác. Điều này không chỉ có thể cải thiện sự an toàn và hiệu quả của xe tự hành mà còn giúp giải quyết một số vấn đề gây khó khăn cho ngành công nghiệp lái xe tự hành từ lâu, chẳng hạn như cách xử lý các tình huống giao thông phức tạp và các yếu tố không chắc chắn.