Baichuan Intelligent выпускае новую стратэгію для аптымізацыі эфектыўнасці трансфарматара

2024-12-27 06:16
 74
Ван Біннін, кіраўнік аддзела папярэдняга навучання ў Baichuan Intelligence, падзяліўся апошнімі вынікамі даследаванняў па аптымізацыі эфектыўнасці трансфарматараў на «Глабальнай канферэнцыі па тэхналогіях машыннага навучання 2024». Ён выказаў здагадку, што шляхам рэалізацыі дзвюх стратэгій аптымізацыі, GQA і MQA, можна эфектыўна вырашыць праблему вузкага месца ўводу/вываду Transformer на этапе дэкадавання, тым самым палепшыўшы эфектыўнасць вываду.