SenseTime uvádí na trh multimodální víceúlohový univerzální velký model „Scholar 2.5“

0
SenseTime nedávno vydal multimodální víceúlohový univerzální velký model s názvem „Scholar 2.5“ s 3 miliardami parametrů. Jedná se o nejpřesnější a největší model ImageNet mezi globálními modely s otevřeným zdrojovým kódem. Tento model dosáhl skóre více než 65,0 mAP v referenční sadě dat COCO detekce objektů a poskytuje efektivní a přesné vnímání a podporu porozumění pro obecné úkoly scénáře, jako je autonomní řízení a roboti. V současné době byl na open source platformě OpenGVLab vydán „Scholar 2.5“.