OpenMixer: Isang bagong diskarte para buksan ang bokabularyo ng pagtuklas ng aksyon

0
Ang OpenMixer ay isang bagong paraan ng pagtukoy ng aksyon sa bukas na bokabularyo na gumagamit ng semantika at pagiging lokal ng malalaking modelo ng visual na wika (VLM), na sinamahan ng disenyo ng mga query-based detection transformer (DETR), upang matagumpay na malutas ang pagtuklas ng aksyon sa bukas na tanong. Ang mga eksperimento ay nagpapakita na ang OpenMixer ay higit na gumaganap sa mga pamamaraan ng baseline sa pagtukoy ng parehong nakikita at hindi nakikitang mga aksyon.