Baichuan Intelligent, Trafo Verimliliği Optimizasyonuna Yönelik Yeni Stratejiyi Açıkladı

74
Baichuan Intelligence ön eğitim başkanı Wang Bingning, "2024 Küresel Makine Öğrenimi Teknolojisi Konferansı"nda Transformer verimliliği optimizasyonuna ilişkin en son araştırma sonuçlarını paylaştı. GQA ve MQA olmak üzere iki optimizasyon stratejisinin uygulanmasıyla, Transformer'ın kod çözme aşamasındaki I/O darboğaz sorununun etkili bir şekilde çözülebileceğini ve dolayısıyla çıkarım verimliliğinin artırılabileceğini öne sürdü.