阿里通義實驗室發布開源語音大模型專案FunAudioLLM-Redplanx

阿里通義實驗室發布開源語音大模型專案FunAudioLLM

阿里巴巴賓士EQE SUV 和和事通義實驗室音訊語言語音模型高精度識別實驗室大模型偵測開源專案事件發布和

2024-07-08 17:00

172

阿里通義實驗室近日發布了開源語音大模型專案FunAudioLLM，該專案包括兩個模型：SenseVoice和CosyVoice。 SenseVoice專注於高精度多語言語音辨識、情緒辨識和音訊事件偵測，支援超過50種語言識別，效果優於Whisper模型。 CosyVoice則專注於自然語音生成，支援多語言、音色和情緒控制。

Prev：奇瑞捷途“纵横”系列发布，瞄准豪华电混越野市场

Next：Alibaba Tongyi Lab releases open source voice large model project FunAudioLLM