OpenMixer: 개방형 어휘 동작 감지에 대한 새로운 접근 방식
화
새로운
VLM
변환기
변환기
성능
성능
이
언어
언어 모델
의미론
문
변환기
공적
용
모델
법
해결
설계
기반
방법
기반
지역
반
규모
변환
방법
2024-12-24 16:53
0
OpenMixer는 DETR(쿼리 기반 감지 변환기)의 설계와 결합된 대규모 시각적 언어 모델(VLM)의 의미론 및 지역화 가능성을 활용하여 개방형 질문에서 동작 감지를 성공적으로 해결하는 새로운 개방형 어휘 동작 감지 방법입니다. 실험에 따르면 OpenMixer는 보이는 동작과 보이지 않는 동작을 모두 감지하는 기본 방법보다 성능이 뛰어납니다.
Prev:OpenMixer: オープンボキャブラリーアクション検出への新しいアプローチ
Next:OpenMixer: Нээлттэй үгсийн сангийн үйлдлийг илрүүлэх шинэ арга
News
Exclusive
Data
Account