Spirit wprowadza na rynek technologię syntezy mowy paranormalnej

2024-12-20 13:38
 1
Spichi uruchomiło technologię syntezy mowy o zjawiskach nadprzyrodzonych, która może w dużym stopniu odtworzyć szczegóły mowy prawdziwych ludzi, w tym cząstki modalne, dźwięki wdechowe, pauzy itp. Technologia ta nadaje się do różnych scenariuszy, takich jak cyfrowi ludzie AI, transmisje informacyjne, inteligentna obsługa klienta itp. Wykorzystując technologię dyskretyzacji cech mowy i duże modele językowe, Spirit z powodzeniem zmniejszył trudność w przewidywaniu ciągłych cech mowy, czyniąc mowę syntezowaną bardziej naturalną, realistyczną i ekspresyjną.