OpenMixer: Nov pristop k zaznavanju dejanj odprtega besedišča

2024-12-24 16:54
 0
OpenMixer je nova odprta metoda zaznavanja dejanj, ki izkorišča semantiko in možnost lokalizacije velikih vizualnih jezikovnih modelov (VLM) v kombinaciji z zasnovo transformatorjev za zaznavanje na podlagi poizvedb (DETR) za uspešno reševanje zaznavanja dejanj v vprašanju odprtega sveta. Poskusi dokazujejo, da OpenMixer prekaša osnovne metode pri zaznavanju vidnih in nevidnih dejanj.