Alibaba Tongyi Lab випускає проект великої мовної моделі FunAudioLLM з відкритим кодом

2024-07-08 17:00
 172
Alibaba Tongyi Lab нещодавно випустила проект великої моделі голосу з відкритим кодом FunAudioLLM, який включає дві моделі: SenseVoice і CosyVoice. SenseVoice зосереджується на високоточному багатомовному розпізнаванні мовлення, розпізнаванні емоцій і виявленні звукових подій. Він підтримує розпізнавання понад 50 мов і є кращим за модель Whisper. CosyVoice зосереджується на створенні природного мовлення та підтримує кілька мов, контроль тембру та емоцій.