OpenMixer:一種新的開放詞彙動作偵測方法

2024-12-24 16:53
 0
OpenMixer是一種全新的開放詞彙動作檢測方法,它利用大型視覺語言模型(VLM)的語義和可定位性,結合基於查詢的檢測變換器(DETR)的設計,成功解決了開放世界中的動作檢測問題。實驗證明,OpenMixer在檢測已見和未見動作方面都優於基線方法。