Alibaba Tongyi Lab brengt open source spraakgroot modelproject FunAudioLLM uit-Redplanx

Alibaba Tongyi Lab heeft onlangs het open source stemmodel FunAudioLLM uitgebracht, dat twee modellen omvat: SenseVoice en CosyVoice. SenseVoice richt zich op uiterst nauwkeurige meertalige spraakherkenning, emotieherkenning en detectie van audiogebeurtenissen. Het ondersteunt meer dan 50 taalherkenning en is beter dan het Whisper-model. CosyVoice richt zich op natuurlijke spraakgeneratie en ondersteunt meerdere talen, timbre en emotiebeheersing.