Alibaba Tongyi Lab izda odprtokodni govorni velik projekt FunAudioLLM

172
Alibaba Tongyi Lab je pred kratkim izdal projekt velikega odprtokodnega glasovnega modela FunAudioLLM, ki vključuje dva modela: SenseVoice in CosyVoice. SenseVoice se osredotoča na visoko natančno prepoznavanje več jezikov, prepoznavanje čustev in zaznavanje zvočnih dogodkov. Podpira prepoznavanje več kot 50 jezikov in je boljši od modela Whisper. CosyVoice se osredotoča na generiranje naravnega govora in podpira več jezikov, nadzor tembra in čustev.