Alibaba Tongyi Lab slipper åpen kildekode tale stort modellprosjekt FunAudioLLM

172
Alibaba Tongyi Lab slapp nylig åpen kildekode-stemmemodellprosjektet FunAudioLLM, som inkluderer to modeller: SenseVoice og CosyVoice. SenseVoice fokuserer på høypresisjon flerspråklig talegjenkjenning, følelsesgjenkjenning og lydhendelsesdeteksjon Den støtter mer enn 50 språkgjenkjenning og er bedre enn Whisper-modellen. CosyVoice fokuserer på naturlig talegenerering og støtter flere språk, klangfarge og følelseskontroll.