Alibaba Tongyi Lab нь нээлттэй эх сурвалжтай ярианы томоохон загвар төсөл FunAudioLLM-г гаргасан

172
Alibaba Tongyi Lab саяхан SenseVoice болон CosyVoice гэсэн хоёр загварыг агуулсан нээлттэй эхийн дуут том загварын FunAudioLLM төслийг гаргасан. SenseVoice нь өндөр нарийвчлалтай олон хэлээр яриа таних, сэтгэл хөдлөлийг таних, аудио үйл явдлыг илрүүлэхэд чиглэгддэг бөгөөд 50 гаруй хэл таних боломжийг дэмждэг бөгөөд Whisper загвараас илүү юм. CosyVoice нь байгалийн яриа үүсгэхэд анхаарлаа төвлөрүүлж, олон хэл, тембр, сэтгэл хөдлөлийн хяналтыг дэмждэг.