Alibaba Tongyi Lab rilascia il grande progetto modello vocale open source FunAudioLLM

172
Alibaba Tongyi Lab ha recentemente rilasciato il progetto di grande modello vocale open source FunAudioLLM, che include due modelli: SenseVoice e CosyVoice. SenseVoice si concentra sul riconoscimento vocale multilingue ad alta precisione, sul riconoscimento delle emozioni e sul rilevamento degli eventi audio. Supporta il riconoscimento di oltre 50 lingue ed è migliore del modello Whisper. CosyVoice si concentra sulla generazione naturale del parlato e supporta più lingue, timbro e controllo delle emozioni.