„Alibaba Tongyi Lab“ išleidžia atvirojo kodo kalbos didelio modelio projektą „FunAudioLLM“.

2024-07-08 17:00
 172
„Alibaba Tongyi Lab“ neseniai išleido atvirojo kodo balso didelio modelio projektą „FunAudioLLM“, kurį sudaro du modeliai: „SenseVoice“ ir „CosyVoice“. „SenseVoice“ orientuojasi į didelio tikslumo kelių kalbų kalbos atpažinimą, emocijų atpažinimą ir garso įvykių aptikimą. Jis palaiko daugiau nei 50 kalbų atpažinimą ir yra geresnis už Whisper modelį. CosyVoice daugiausia dėmesio skiria natūralios kalbos generavimui ir palaiko kelias kalbas, tembro ir emocijų valdymą.