Alibaba Tongyi Lab lëshon projektin e modelit të madh të fjalës me burim të hapur FunAudioLLM

2024-07-08 17:00
 172
Alibaba Tongyi Lab publikoi së fundmi projektin e modelit të madh të zërit me burim të hapur FunAudioLLM, i cili përfshin dy modele: SenseVoice dhe CosyVoice. SenseVoice fokusohet në njohjen shumëgjuhëshe të të folurit me saktësi të lartë, njohjen e emocioneve dhe zbulimin e ngjarjeve audio. Ai mbështet më shumë se 50 njohje të gjuhëve dhe është më i mirë se modeli Whisper. CosyVoice fokusohet në gjenerimin e të folurit natyral dhe mbështet gjuhë të shumta, timbrin dhe kontrollin e emocioneve.