Alibaba Tongyi Lab rilascia il grande progetto modello vocale open source FunAudioLLM-Redplanx

Alibaba Tongyi Lab ha recentemente rilasciato il progetto di grande modello vocale open source FunAudioLLM, che include due modelli: SenseVoice e CosyVoice. SenseVoice si concentra sul riconoscimento vocale multilingue ad alta precisione, sul riconoscimento delle emozioni e sul rilevamento degli eventi audio. Supporta il riconoscimento di oltre 50 lingue ed è migliore del modello Whisper. CosyVoice si concentra sulla generazione naturale del parlato e supporta più lingue, timbro e controllo delle emozioni.