Alibaba Tongyi Lab เปิดตัว FunAudioLLM โปรเจ็กต์โมเดลโอเพ่นซอร์สขนาดใหญ่

172
เมื่อเร็วๆ นี้ Alibaba Tongyi Lab ได้เปิดตัวโปรเจ็กต์โมเดลเสียงโอเพ่นซอร์สขนาดใหญ่ FunAudioLLM ซึ่งมี 2 รุ่น ได้แก่ SenseVoice และ CosyVoice SenseVoice มุ่งเน้นไปที่การรู้จำคำพูดหลายภาษาที่มีความแม่นยำสูง การรู้จำอารมณ์ และการตรวจจับเหตุการณ์เสียง รองรับการรู้จำภาษามากกว่า 50 ภาษา และดีกว่ารุ่น Whisper CosyVoice มุ่งเน้นไปที่การสร้างคำพูดที่เป็นธรรมชาติและรองรับหลายภาษา เสียงต่ำ และการควบคุมอารมณ์