Baichuan Intelligent випускає нову стратегію для оптимізації ефективності трансформатора

2024-12-27 06:16
 74
Ван Біннін, керівник відділу попереднього навчання в Baichuan Intelligence, поділився останніми результатами дослідження оптимізації ефективності трансформаторів на «2024 Global Machine Learning Technology Conference». Він запропонував, що шляхом впровадження двох стратегій оптимізації, GQA та MQA, можна ефективно вирішити проблему вузьких місць вводу/виводу Transformer на етапі декодування, тим самим підвищуючи ефективність логічного висновку.