Ang Alibaba Tongyi Lab ay naglabas ng open source speech na malaking modelo ng proyekto na FunAudioLLM-Redplanx

Kamakailan ay inilabas ng Alibaba Tongyi Lab ang open source na voice large model project na FunAudioLLM, na kinabibilangan ng dalawang modelo: SenseVoice at CosyVoice. Nakatuon ang SenseVoice sa high-precision multi-language speech recognition, pagkilala sa emosyon at audio event detection Sinusuportahan nito ang higit sa 50 pagkilala sa wika at mas mahusay kaysa sa Whisper model. Nakatuon ang CosyVoice sa natural na pagbuo ng pagsasalita at sinusuportahan ang maraming wika, timbre at kontrol sa emosyon.