OpenMixer: یک رویکرد جدید برای تشخیص اقدامات واژگان باز

2024-12-24 16:54
 0
OpenMixer یک روش تشخیص کنش واژگان باز جدید است که از معناشناسی و بومی‌سازی مدل‌های زبان بصری بزرگ (VLM)، همراه با طراحی ترانسفورماتورهای تشخیص مبتنی بر پرس و جو (DETR) استفاده می‌کند تا با موفقیت تشخیص کنش را در دنیای باز حل کند. آزمایش‌ها نشان می‌دهند که OpenMixer از روش‌های پایه در تشخیص اقدامات دیده‌شده و نادیده بهتر عمل می‌کند.