OpenMixer: jauna pieeja atvērto vārdu krājuma darbību noteikšanai

0
OpenMixer ir jauna atvērtā vārdu krājuma darbību noteikšanas metode, kas izmanto lielu vizuālo valodu modeļu (VLM) semantiku un lokalizējamību, apvienojumā ar uz vaicājumiem balstītu noteikšanas transformatoru (DETR) dizainu, lai veiksmīgi atrisinātu darbību noteikšanu atvērtajā pasaulē. Eksperimenti parāda, ka OpenMixer pārspēj bāzes metodes, nosakot gan redzētas, gan neredzētas darbības.