OpenMixer: Ett nytt tillvägagångssätt för detektering av öppna ordförråd

2024-12-24 16:54
 0
OpenMixer är en ny metod för detektering av öppen ordförråd som utnyttjar semantiken och lokaliserbarheten hos stora visuella språkmodeller (VLM), kombinerat med designen av frågebaserade detektionstransformatorer (DETR), för att framgångsrikt lösa handlingsdetektering i den öppna världen. Experiment visar att OpenMixer överträffar baslinjemetoder när det gäller att upptäcka både sedda och osynliga åtgärder.