Baichuan Intelligent izdaja novo strategijo za optimizacijo učinkovitosti transformatorjev

74
Wang Bingning, vodja predhodnega usposabljanja pri Baichuan Intelligence, je delil najnovejše rezultate raziskav o optimizaciji učinkovitosti transformatorjev na "Globalni konferenci o tehnologiji strojnega učenja 2024". Predlagal je, da je mogoče z implementacijo dveh optimizacijskih strategij, GQA in MQA, učinkovito rešiti problem V/I ozkega grla Transformerja v fazi dekodiranja in s tem izboljšati učinkovitost sklepanja.