Alibaba Tongyi Lab, açık kaynaklı konuşma büyük model projesi FunAudioLLM'yi yayınladı

172
Alibaba Tongyi Lab kısa süre önce iki modeli içeren açık kaynaklı ses büyük model projesi FunAudioLLM'yi yayınladı: SenseVoice ve CosyVoice. SenseVoice, yüksek hassasiyetli çoklu dil konuşma tanıma, duygu tanıma ve ses olayı algılamaya odaklanır. 50'den fazla dil tanımayı destekler ve Whisper modelinden daha iyidir. CosyVoice doğal konuşma oluşturmaya odaklanır ve birden fazla dili, tınıyı ve duygu kontrolünü destekler.