OpenMixer: শব্দভান্ডার ক্রিয়া সনাক্তকরণ খোলার জন্য একটি নতুন পদ্ধতি

2024-12-24 16:54
 0
OpenMixer হল একটি নতুন ওপেন ভোকাবুলারি অ্যাকশন ডিটেকশন পদ্ধতি যা বৃহৎ ভিজ্যুয়াল ল্যাঙ্গুয়েজ মডেলের (VLM) শব্দার্থবিদ্যা এবং লোকালাইজেবিলিটি, কোয়েরি-ভিত্তিক ডিটেকশন ট্রান্সফরমার (DETR) এর ডিজাইনের সাথে একত্রিত করে, উন্মুক্ত বিশ্বে অ্যাকশন ডিটেকশনকে সফলভাবে সমাধান করে। পরীক্ষাগুলি দেখায় যে OpenMixer দেখা এবং অদেখা উভয় ক্রিয়া সনাক্তকরণে বেসলাইন পদ্ধতিগুলিকে ছাড়িয়ে যায়।