A SenseTime kiadja a "Scholar 2.5" multimodális többfeladatos univerzális nagy modellt

0
A SenseTime a közelmúltban kiadott egy multimodális, többfeladatos univerzális nagymodellt "Scholar 2.5" néven, 3 milliárd paraméterrel. Ez a legpontosabb és legnagyobb ImageNet modell a globális nyílt forráskódú modellek között. Ez a modell több mint 65,0 mAP pontszámot ért el a COCO tárgyészlelési referenciaadatkészletben, hatékony és pontos észlelést és megértést biztosítva az általános forgatókönyv-feladatokhoz, például az autonóm vezetéshez és a robotokhoz. Jelenleg a "Scholar 2.5" az OpenGVLab nyílt forráskódú platformon jelent meg.