OpenMixer: Μια νέα προσέγγιση για την ανίχνευση ενεργειών ανοιχτού λεξιλογίου

2024-12-24 16:54
 0
Το OpenMixer είναι μια νέα μέθοδος ανίχνευσης ενεργειών ανοιχτού λεξιλογίου που αξιοποιεί τη σημασιολογία και την τοπικοποίηση μεγάλων μοντέλων οπτικής γλώσσας (VLM), σε συνδυασμό με το σχεδιασμό μετασχηματιστών ανίχνευσης βάσει ερωτημάτων (DETR), για την επιτυχή επίλυση της ανίχνευσης ενεργειών στον ανοιχτό κόσμο. Τα πειράματα καταδεικνύουν ότι το OpenMixer υπερέχει των βασικών μεθόδων στον εντοπισμό ενεργειών που φαίνονται και μη.