Alibaba Tongyi Lab lança projeto de grande modelo de fala de código aberto FunAudioLLM

2024-07-08 17:00
 172
Alibaba Tongyi Lab lançou recentemente o grande projeto de modelo de voz de código aberto FunAudioLLM, que inclui dois modelos: SenseVoice e CosyVoice. SenseVoice concentra-se no reconhecimento de fala multilíngue de alta precisão, reconhecimento de emoções e detecção de eventos de áudio. Ele suporta mais de 50 reconhecimentos de idiomas e é melhor que o modelo Whisper. CosyVoice concentra-se na geração natural de fala e oferece suporte a vários idiomas, timbre e controle de emoções.