OpenMixer: A nyílt szókincsműveletek észlelésének új megközelítése

0
Az OpenMixer egy új nyílt szókincs-művelet-észlelési módszer, amely a nagy vizuális nyelvi modellek (VLM) szemantikáját és lokalizálhatóságát a lekérdezés-alapú észlelési transzformátorok (DETR) tervezésével kombinálva sikeresen megoldja a műveletek észlelését a nyílt világban. A kísérletek azt mutatják, hogy az OpenMixer felülmúlja az alapmódszereket a látott és nem látott műveletek észlelésében.