阿里通义实验室发布开源语音大模型项目FunAudioLLM

2024-07-08 17:00
 172
阿里通义实验室近日发布了开源语音大模型项目FunAudioLLM,该项目包括两个模型:SenseVoice和CosyVoice。SenseVoice专注于高精度多语言语音识别、情感辨识和音频事件检测,支持超过50种语言识别,效果优于Whisper模型。CosyVoice则专注于自然语音生成,支持多语言、音色和情感控制。