Alibaba Tongyi Lab veröffentlicht das große Open-Source-Sprachmodellprojekt FunAudioLLM-Redplanx

Alibaba Tongyi Lab hat kürzlich das große Open-Source-Sprachmodellprojekt FunAudioLLM veröffentlicht, das zwei Modelle umfasst: SenseVoice und CosyVoice. SenseVoice konzentriert sich auf die hochpräzise mehrsprachige Spracherkennung, Emotionserkennung und Audioereigniserkennung. Es unterstützt mehr als 50 Spracherkennungen und ist besser als das Whisper-Modell. CosyVoice konzentriert sich auf die natürliche Spracherzeugung und unterstützt mehrere Sprachen sowie die Kontrolle von Klangfarbe und Emotionen.