SenseTime vydáva multimodálny viacúlohový univerzálny veľký model „Scholar 2.5“

2024-12-20 10:35
 0
SenseTime nedávno vydal multimodálny multi-úlohový univerzálny veľký model s názvom „Scholar 2.5“ s 3 miliardami parametrov. Ide o najpresnejší a najväčší model ImageNet spomedzi globálnych modelov s otvoreným zdrojom. Tento model dosiahol skóre viac ako 65,0 mAP v referenčnom súbore údajov na detekciu objektov COCO, čo poskytuje efektívne a presné vnímanie a podporu pochopenia pre všeobecné úlohy scenára, ako je autonómne riadenie a roboty. V súčasnosti je na open source platforme OpenGVLab vydaný „Scholar 2.5“.