阿里通义实验室发布开源语音大模型项目FunAudioLLM
阿里巴巴
通义实验室
音频
语言
语音
模型
高精度
情感
识别
实验室
大模型
检测
开源
项目
2024-07-08 17:00
172
阿里通义实验室近日发布了开源语音大模型项目FunAudioLLM,该项目包括两个模型:SenseVoice和CosyVoice。SenseVoice专注于高精度多语言语音识别、情感辨识和音频事件检测,支持超过50种语言识别,效果优于Whisper模型。CosyVoice则专注于自然语音生成,支持多语言、音色和情感控制。
Prev:欣旺达构建全产业链一体化事业蓝图
Next:天合储能与TÜV南德针对欧盟新电池法规开展战略合作
快报
一手资料
数据
个人中心