OpenMixer: Eng nei Approche fir oppe Vokabuläraktiounsdetektioun

2024-12-24 16:54
 0
OpenMixer ass eng nei oppe Vokabuläraktiounsdetektiounsmethod déi d'Semantik an d'Lokaliséierung vu grousse visuelle Sproochmodeller (VLM) benotzt, kombinéiert mat dem Design vu Query-baséiert Detektiounstransformatoren (DETR), fir Handlungserkennung an der oppener Welt erfollegräich ze léisen. Experimenter weisen datt OpenMixer d'Basismethod besser mécht fir gesi wéi an onsiichtbar Handlungen z'entdecken.