OpenMixer: یک رویکرد جدید برای تشخیص اقدامات واژگان باز

0
OpenMixer یک روش تشخیص کنش واژگان باز جدید است که از معناشناسی و بومیسازی مدلهای زبان بصری بزرگ (VLM)، همراه با طراحی ترانسفورماتورهای تشخیص مبتنی بر پرس و جو (DETR) استفاده میکند تا با موفقیت تشخیص کنش را در دنیای باز حل کند. آزمایشها نشان میدهند که OpenMixer از روشهای پایه در تشخیص اقدامات دیدهشده و نادیده بهتر عمل میکند.