Alibaba Tongyi Lab frigiver open source tale stort modelprojekt FunAudioLLM-Redplanx

Alibaba Tongyi Lab udgav for nylig open source-stemmeprojektet FunAudioLLM, som omfatter to modeller: SenseVoice og CosyVoice. SenseVoice fokuserer på højpræcision flersproget talegenkendelse, følelsesgenkendelse og lydhændelsesgenkendelse Den understøtter mere end 50 sproggenkendelse og er bedre end Whisper-modellen. CosyVoice fokuserer på naturlig talegenerering og understøtter flere sprog, klang- og følelseskontrol.