Les chercheurs découvrent qu’un grand modèle de langage multimodal présente une pensée spatiale

0
Récemment, une étude menée par l'équipe de Li Feifei et Xie Saining a révélé que le modèle multimodal de langage étendu (MLLM) peut mémoriser et rappeler l'espace, et même former un modèle de monde local en interne, montrant une conscience spatiale. Leurs recherches ont souligné que le raisonnement spatial est crucial pour l’intelligence humaine et ont prédit qu’en 2025, les limites de l’intelligence spatiale pourraient à nouveau être dépassées.