Alibaba Tongyi Lab izlaiž atvērtā koda runas liela modeļa projektu FunAudioLLM

2024-07-08 17:00
 172
Alibaba Tongyi Lab nesen izlaida atvērtā koda balss liela modeļa projektu FunAudioLLM, kas ietver divus modeļus: SenseVoice un CosyVoice. SenseVoice koncentrējas uz augstas precizitātes vairāku valodu runas atpazīšanu, emociju atpazīšanu un audio notikumu atpazīšanu. Tā atbalsta vairāk nekā 50 valodu atpazīšanu un ir labāka par Whisper modeli. CosyVoice koncentrējas uz dabiskas runas ģenerēšanu un atbalsta vairākas valodas, tembru un emociju kontroli.