သုတေသနအသစ်သည် spatial ဆင်ခြင်ခြင်းတွင် multimodal ကြီးမားသောဘာသာစကားမော်ဒယ်များ၏အလားအလာကိုဖော်ပြသည်။

0
လေ့လာမှုအသစ်တစ်ခုက Multimodal large language model (MLLM) သည် spatial reasoning တွင် ကြီးမားသော အလားအလာကို ပြသသည် ။ မော်ဒယ်၏ အထူးဒီဇိုင်းနှင့် စိန်ခေါ်မှုများကို စမ်းသပ်ခြင်းမှတစ်ဆင့် MLLM သည် နေရာဒေသအလိုက် ဆက်စပ်အချက်အလက်များကို ထိထိရောက်ရောက် နားလည်နိုင်ပြီး အချို့ကိစ္စများတွင် မော်ဒယ်၏စွမ်းဆောင်ရည်ကို မြှင့်တင်ရန် လိုအပ်နေသေးသော်လည်း သုတေသီများက တွေ့ရှိခဲ့သည်။