OpenMixer: uus lähenemine avatud sõnavara toimingute tuvastamisele

0
OpenMixer on uus avatud sõnavara toimingute tuvastamise meetod, mis kasutab suurte visuaalsete keelemudelite (VLM) semantikat ja lokaliseeritavust koos päringupõhiste tuvastustrafode (DETR) disainiga, et lahendada tegevuste tuvastamine avatud maailmas. Katsed näitavad, et OpenMixer ületab algtaseme meetodid nii nähtud kui ka nähtamatute toimingute tuvastamisel.