تطلق SenseTime النموذج العالمي الكبير متعدد الوسائط والمهام "Scholar 2.5"

2024-12-20 10:35
 0
أصدرت SenseTime مؤخرًا نموذجًا عالميًا كبيرًا متعدد الوسائط ومتعدد المهام يسمى "Scholar 2.5"، مع 3 مليارات معلمة، وهو نموذج ImageNet الأكثر دقة والأكبر بين النماذج العالمية مفتوحة المصدر. حقق هذا النموذج درجة تزيد عن 65.0 مللي أمبير في مجموعة البيانات القياسية للكشف عن الكائنات COCO، مما يوفر دعمًا فعالاً ودقيقًا للإدراك والفهم لمهام السيناريو العامة مثل القيادة الذاتية والروبوتات. حاليًا، تم إصدار "Scholar 2.5" على منصة OpenGVLab مفتوحة المصدر.