Baichuan Intelligent აქვეყნებს ახალ სტრატეგიას ტრანსფორმატორის ეფექტურობის ოპტიმიზაციისთვის

2024-12-27 06:16
 74
Wang Bingning, წინასწარი ტრენინგის ხელმძღვანელმა Baichuan Intelligence-ში, გააზიარა უახლესი კვლევის შედეგები ტრანსფორმატორის ეფექტურობის ოპტიმიზაციის შესახებ "2024 Global Machine Learning Technology კონფერენციაზე". მან შესთავაზა, რომ ოპტიმიზაციის ორი სტრატეგიის, GQA და MQA განხორციელებით, ტრანსფორმატორის I/O ბოთლის პრობლემა დეკოდირების ეტაპზე შეიძლება ეფექტურად გადაიჭრას, რითაც გაუმჯობესდება დასკვნის ეფექტურობა.