Το Alibaba Tongyi Lab κυκλοφόρησε το έργο μεγάλου μοντέλου ομιλίας ανοιχτού κώδικα FunAudioLLM

2024-07-08 17:00
 172
Η Alibaba Tongyi Lab κυκλοφόρησε πρόσφατα το έργο ανοιχτού κώδικα φωνής μεγάλου μοντέλου FunAudioLLM, το οποίο περιλαμβάνει δύο μοντέλα: το SenseVoice και το CosyVoice. Το SenseVoice εστιάζει στην πολυγλωσσική αναγνώριση ομιλίας υψηλής ακρίβειας, στην αναγνώριση συναισθημάτων και στην ανίχνευση συμβάντων ήχου. Υποστηρίζει αναγνώριση περισσότερων από 50 γλωσσών και είναι καλύτερο από το μοντέλο Whisper. Το CosyVoice εστιάζει στη δημιουργία φυσικής ομιλίας και υποστηρίζει πολλαπλές γλώσσες, ηχογράφηση και έλεγχο συναισθημάτων.