研究者は、マルチモーダルな大規模言語モデルが空間的思考を示すことを発見しました-Redplanx

最近、Li Feifei 氏と Xie Saining 氏のチームによる研究で、マルチモーダル大言語モデル (MLLM) が空間を記憶および想起し、さらには内部的にローカルな世界モデルを形成して空間認識を示すことができることが判明しました。彼らの研究は、空間的推論が人間の知性にとって極めて重要であることを指摘し、2025 年には空間的知性の限界が再び破られるかもしれないと予測しました。