Alibaba Tongyi Lab lance un grand projet de modèle de parole open source FunAudioLLM

172
Alibaba Tongyi Lab a récemment publié le projet de grand modèle vocal open source FunAudioLLM, qui comprend deux modèles : SenseVoice et CosyVoice. SenseVoice se concentre sur la reconnaissance vocale multilingue de haute précision, la reconnaissance des émotions et la détection d'événements audio. Il prend en charge plus de 50 langues et est meilleur que le modèle Whisper. CosyVoice se concentre sur la génération naturelle de la parole et prend en charge plusieurs langues, le contrôle du timbre et des émotions.