연구원들은 다중 모드 대형 언어 모델이 공간적 사고를 보여준다는 사실을 발견했습니다.

2024-12-25 09:55
 0
최근 Li Feifei와 Xie Saining 팀의 연구에 따르면 MLLM(다중 모드 대형 언어 모델)이 공간을 기억하고 회상할 수 있으며 내부적으로 로컬 세계 모델을 형성하여 공간 인식을 보여줄 수도 있다는 사실이 밝혀졌습니다. 그들의 연구는 공간 추론이 인간 지능에 매우 중요하다는 점을 지적했으며, 2025년에는 공간 지능의 경계가 다시 무너질 수 있다고 예측했습니다.