OpenMixer: Pendekatan baru untuk membuka deteksi tindakan kosakata

0
OpenMixer adalah metode deteksi tindakan kosakata terbuka baru yang memanfaatkan semantik dan kemampuan lokalisasi model bahasa visual (VLM) berskala besar, dikombinasikan dengan desain transformator deteksi berbasis kueri (DETR), agar berhasil menyelesaikan deteksi tindakan di dunia terbuka. pertanyaan. Eksperimen menunjukkan bahwa OpenMixer mengungguli metode dasar dalam mendeteksi tindakan yang terlihat dan tidak terlihat.