OpenMixer: Pendekatan baharu untuk membuka pengesanan tindakan perbendaharaan kata

2024-12-24 16:54
 0
OpenMixer ialah kaedah pengesanan tindakan perbendaharaan kata terbuka baharu yang memanfaatkan semantik dan kebolehlokalan model bahasa visual besar (VLM), digabungkan dengan reka bentuk transformer pengesanan berasaskan pertanyaan (DETR), untuk berjaya menyelesaikan pengesanan tindakan dalam soalan dunia terbuka. Eksperimen menunjukkan bahawa OpenMixer mengatasi kaedah asas dalam mengesan kedua-dua tindakan yang dilihat dan tidak dilihat.