Alibaba Tongyi Lab משחררת פרויקט דיבור גדול בקוד פתוח FunAudioLLM

2024-07-08 17:00
 172
מעבדת Alibaba Tongyi הוציאה לאחרונה את פרויקט המודל הגדול של הקוד הפתוח FunAudioLLM, הכולל שני דגמים: SenseVoice ו-CosyVoice. SenseVoice מתמקדת בזיהוי דיבור רב שפות, זיהוי רגשות וזיהוי אירועי אודיו, הוא תומך ביותר מ-50 זיהוי שפות והוא טוב יותר מדגם Whisper. CosyVoice מתמקדת ביצירת דיבור טבעי ותומכת במספר שפות, בקרת גוון ורגשות.