Baichuan Intelligent julkaisee uuden muuntajan tehokkuuden optimointistrategian

74
Wang Bingning, Baichuan Intelligencen esikoulutuksen johtaja, jakoi viimeisimmät tutkimustulokset muuntajien tehokkuuden optimoinnista "2024 Global Machine Learning Technology Conference -konferenssissa". Hän ehdotti, että ottamalla käyttöön kaksi optimointistrategiaa, GQA ja MQA, Transformerin I/O-pullonkaulaongelma dekoodausvaiheessa voidaan ratkaista tehokkaasti, mikä parantaa päättelytehokkuutta.