Alibaba Tongyi Lab açıq mənbəli nitq böyük model layihəsi FunAudioLLM-i buraxır

172
Alibaba Tongyi Lab bu yaxınlarda iki modeli ehtiva edən açıq mənbəli səsli böyük model layihəsi FunAudioLLM-ni buraxdı: SenseVoice və CosyVoice. SenseVoice yüksək dəqiqlikli çoxdilli nitqin tanınması, emosiyaların tanınması və audio hadisənin aşkarlanmasına diqqət yetirir və 50-dən çox dilin tanınmasını dəstəkləyir və Whisper modelindən daha yaxşıdır. CosyVoice təbii nitqin yaranmasına diqqət yetirir və bir çox dilləri, tembr və emosiya nəzarətini dəstəkləyir.