La nueva generación del modelo de lenguaje grande "Scholar·Puyu 2.0" es oficialmente de código abierto

1
SenseTime y el Laboratorio de IA de Shanghai, junto con la Universidad China de Hong Kong y la Universidad de Fudan, lanzaron una nueva generación de modelo de lenguaje grande "Scholar·Puyu 2.0". Este modelo admite un contexto ultralargo de 200 000 y puede procesar aproximadamente 300 000 caracteres chinos a la vez. El modelo ha logrado avances significativos en matemáticas, codificación, diálogo, creación, etc., y su rendimiento integral está por delante del mismo nivel de los modelos de código abierto.