अलीबाबा टोंगी लैब ने ओपन सोर्स स्पीच लार्ज मॉडल प्रोजेक्ट फ़नऑडियोएलएलएम जारी किया

2024-07-08 17:00
 172
अलीबाबा टोंगी लैब ने हाल ही में ओपन सोर्स वॉयस लार्ज मॉडल प्रोजेक्ट फनऑडियोएलएलएम जारी किया है, जिसमें दो मॉडल शामिल हैं: सेंसवॉइस और कोसीवॉइस। SenseVoice उच्च परिशुद्धता बहु-भाषा वाक् पहचान, भावना पहचान और ऑडियो घटना पहचान पर केंद्रित है। यह 50 से अधिक भाषा पहचान का समर्थन करता है और व्हिस्पर मॉडल से बेहतर है। CosyVoice प्राकृतिक भाषण निर्माण पर ध्यान केंद्रित करता है और कई भाषाओं, समय और भावना नियंत्रण का समर्थन करता है।