يُصدر Alibaba Tongyi Lab مشروعًا نموذجيًا كبيرًا للكلام مفتوح المصدر FunAudioLLM

2024-07-08 17:00
 172
أصدر Alibaba Tongyi Lab مؤخرًا مشروعًا ضخمًا للصوت مفتوح المصدر FunAudioLLM، والذي يتضمن نموذجين: SenseVoice وCosyVoice. يركز SenseVoice على التعرف على الكلام متعدد اللغات عالي الدقة والتعرف على المشاعر واكتشاف الأحداث الصوتية وهو يدعم التعرف على أكثر من 50 لغة وهو أفضل من نموذج Whisper. يركز CosyVoice على توليد الكلام الطبيعي ويدعم اللغات المتعددة والجرس والتحكم في العاطفة.