SenseTime merilis model besar universal multi-modal multi-tugas "Scholar 2.5"

0
SenseTime baru-baru ini merilis model besar universal multi-tugas multi-modal yang disebut "Scholar 2.5", dengan 3 miliar parameter. Ini adalah model ImageNet paling akurat dan terbesar di antara model sumber terbuka global. Model ini mencapai skor lebih dari 65,0 mAP dalam kumpulan data benchmark deteksi objek COCO, memberikan dukungan persepsi dan pemahaman yang efisien dan akurat untuk tugas-tugas umum seperti mengemudi otonom dan robot. Saat ini, "Scholar 2.5" telah dirilis pada platform sumber terbuka OpenGVLab.