Alibaba Tongyi laboratoriyasi FunAudioLLM ochiq manbali nutqning katta model loyihasini chiqaradi

172
Alibaba Tongyi Lab yaqinda FunAudioLLM ochiq manbali ovozli katta model loyihasini chiqardi, u ikkita modelni o'z ichiga oladi: SenseVoice va CosyVoice. SenseVoice yuqori aniqlikdagi koʻp tilli nutqni aniqlash, his-tuygʻularni aniqlash va audio hodisalarni aniqlashga qaratilgan boʻlib, u 50 dan ortiq tilni aniqlashni qoʻllab-quvvatlaydi va Whisper modelidan yaxshiroq. CosyVoice nutqni tabiiy yaratishga qaratilgan va bir nechta tillarni, tembr va hissiyotlarni boshqarishni qo'llab-quvvatlaydi.