Alibaba Tongyi Lab выпускае праект вялікай мадэлі маўлення з адкрытым зыходным кодам FunAudioLLM

172
Лабараторыя Alibaba Tongyi нядаўна выпусціла вялікі праект галасавой мадэлі FunAudioLLM з адкрытым зыходным кодам, які ўключае дзве мадэлі: SenseVoice і CosyVoice. SenseVoice арыентаваны на высокадакладнае шматмоўнае распазнаванне маўлення, распазнаванне эмоцый і выяўленне гукавых падзей. Ён падтрымлівае больш чым 50 моў і лепш, чым мадэль Whisper. CosyVoice факусуюць на генерацыі натуральнай гаворкі і падтрымліваюць некалькі моў, кантроль тэмбру і эмоцый.