СенсеТиме објављује мултимодални мулти-таск универзални велики модел "Сцхолар 2.5"

0
СенсеТиме је недавно објавио мултимодални мулти-таск универзални велики модел под називом "Сцхолар 2.5", са 3 милијарде параметара. То је најтачнији и највећи ИмагеНет модел међу глобалним моделима отвореног кода. Овај модел је постигао резултат од више од 65,0 мАП у скупу података ЦОЦО за бенцхмарк детекције објеката, пружајући ефикасну и тачну подршку за перцепцију и разумевање општих задатака на сцени као што су аутономна вожња и роботи. Тренутно је „Сцхолар 2.5“ објављен на ОпенГВЛаб платформи отвореног кода.