Alibaba Tongyi Lab, 오픈 소스 음성 대형 모델 프로젝트 FunAudioLLM 출시

172
Alibaba Tongyi Lab은 최근 SenseVoice와 CosyVoice라는 두 가지 모델을 포함하는 오픈 소스 음성 대형 모델 프로젝트 FunAudioLLM을 출시했습니다. SenseVoice는 고정밀 다국어 음성 인식, 감정 인식 및 오디오 이벤트 감지에 중점을 두고 있으며 50개 이상의 언어 인식을 지원하며 Whisper 모델보다 우수합니다. CosyVoice는 자연스러운 음성 생성에 중점을 두고 다양한 언어, 음색 및 감정 제어를 지원합니다.