Alibaba Tongyi Lab avaldab avatud lähtekoodiga kõne suure mudeliprojekti FunAudioLLM

2024-07-08 17:00
 172
Alibaba Tongyi Lab avaldas hiljuti avatud lähtekoodiga häälmudeli projekti FunAudioLLM, mis sisaldab kahte mudelit: SenseVoice ja CosyVoice. SenseVoice keskendub ülitäpsele mitmekeelsele kõnetuvastusele, emotsioonide tuvastamisele ja helisündmuste tuvastamisele. See toetab enam kui 50 keeletuvastust ja on parem kui Whisper mudel. CosyVoice keskendub loomulikule kõne genereerimisele ja toetab mitut keelt, tämbrit ja emotsioonide juhtimist.