Baichuan Intelligent выпускае новую стратэгію для аптымізацыі эфектыўнасці трансфарматара

74
Ван Біннін, кіраўнік аддзела папярэдняга навучання ў Baichuan Intelligence, падзяліўся апошнімі вынікамі даследаванняў па аптымізацыі эфектыўнасці трансфарматараў на «Глабальнай канферэнцыі па тэхналогіях машыннага навучання 2024». Ён выказаў здагадку, што шляхам рэалізацыі дзвюх стратэгій аптымізацыі, GQA і MQA, можна эфектыўна вырашыць праблему вузкага месца ўводу/вываду Transformer на этапе дэкадавання, тым самым палепшыўшы эфектыўнасць вываду.