Alibaba Tongyi ল্যাব ওপেন সোর্স স্পিচ বড় মডেল প্রকল্প FunAudioLLM প্রকাশ করেছে

172
Alibaba Tongyi ল্যাব সম্প্রতি ওপেন সোর্স ভয়েস বড় মডেল প্রকল্প FunAudioLLM প্রকাশ করেছে, যার মধ্যে দুটি মডেল রয়েছে: SenseVoice এবং CosyVoice৷ SenseVoice উচ্চ-নির্ভুল বহু-ভাষা স্পিচ রিকগনিশন, ইমোশন রিকগনিশন এবং অডিও ইভেন্ট সনাক্তকরণের উপর ফোকাস করে এটি 50 টিরও বেশি ভাষা স্বীকৃতিকে সমর্থন করে এবং হুইস্পার মডেলের চেয়ে ভাল। CosyVoice প্রাকৃতিক বক্তৃতা তৈরিতে ফোকাস করে এবং একাধিক ভাষা, টিমব্রে এবং আবেগ নিয়ন্ত্রণ সমর্থন করে।