Penyelidikan baharu mendedahkan potensi model bahasa besar multimodal dalam penaakulan spatial

0
Satu kajian baharu menunjukkan bahawa model bahasa besar multimodal (MLLM) menunjukkan potensi besar dalam penaakulan spatial. Melalui reka bentuk khas dan ujian model yang mencabar, para penyelidik mendapati bahawa MLLM boleh memahami dan memproses maklumat yang berkaitan dengan ruang secara berkesan, walaupun dalam beberapa kes, prestasi model masih perlu dipertingkatkan.