Alibaba Tongyi Lab lansează proiectul de model mare de vorbire cu sursă deschisă FunAudioLLM-Redplanx

Alibaba Tongyi Lab a lansat recent proiectul de model mare de voce cu sursă deschisă FunAudioLLM, care include două modele: SenseVoice și CosyVoice. SenseVoice se concentrează pe recunoașterea de înaltă precizie a vorbirii în mai multe limbi, recunoașterea emoțiilor și detectarea evenimentelor audio. Acceptă recunoașterea a peste 50 de limbi și este mai bun decât modelul Whisper. CosyVoice se concentrează pe generarea naturală a vorbirii și acceptă mai multe limbi, controlul timbrului și al emoțiilor.