OpenMixer : une nouvelle approche de la détection d'actions de vocabulaire ouvert

2024-12-24 16:53
 0
OpenMixer est une nouvelle méthode de détection d'actions à vocabulaire ouvert qui exploite la sémantique et la localisabilité de modèles de langage visuel (VLM) à grande échelle, combinées à la conception de transformateurs de détection basés sur des requêtes (DETR), pour résoudre avec succès la détection d'actions dans le monde ouvert. question. Les expériences démontrent qu'OpenMixer surpasse les méthodes de base dans la détection des actions visibles et invisibles.