SenseTime izdaje multimodalni univerzalni veliki model za više zadataka "Scholar 2.5"

0
SenseTime je nedavno objavio multimodalni univerzalni veliki model za više zadataka pod nazivom "Scholar 2.5", s 3 milijarde parametara. To je najprecizniji i najveći ImageNet model među globalnim modelima otvorenog koda. Ovaj je model postigao rezultat veći od 65,0 mAP u referentnom skupu podataka za otkrivanje objekata COCO, pružajući učinkovitu i točnu podršku percepcije i razumijevanja za zadatke općeg scenarija kao što su autonomna vožnja i roboti. Trenutno je "Scholar 2.5" objavljen na platformi otvorenog koda OpenGVLab.