Alibaba Tongyi Lab släpper ett stort modellprojekt för tal med öppen källkod FunAudioLLM

2024-07-08 17:00
 172
Alibaba Tongyi Lab släppte nyligen det stora modellprojektet FunAudioLLM med öppen källkod, som inkluderar två modeller: SenseVoice och CosyVoice. SenseVoice fokuserar på högprecision för flerspråkig taligenkänning, känsloregkänning och ljudhändelsedetektering Den stöder mer än 50 språkigenkänning och är bättre än Whisper-modellen. CosyVoice fokuserar på naturlig talgenerering och stöder flera språk, klangfärg och känslokontroll.