阿里通義實驗室發布開源語音大模型專案FunAudioLLM

2024-07-08 17:00
 172
阿里通義實驗室近日發布了開源語音大模型專案FunAudioLLM,該專案包括兩個模型:SenseVoice和CosyVoice。 SenseVoice專注於高精度多語言語音辨識、情緒辨識和音訊事件偵測,支援超過50種語言識別,效果優於Whisper模型。 CosyVoice則專注於自然語音生成,支援多語言、音色和情緒控制。