Baichuan Intelligent သည် Transformer Efficiency Optimization အတွက် နည်းဗျူဟာအသစ်ကို ထုတ်ပြန်ခဲ့သည်။

74
Baichuan Intelligence မှ အကြိုလေ့ကျင့်ရေးမှူး Wang Bingning သည် "2024 Global Machine Learning Technology Conference" တွင် Transformer efficiency optimization ဆိုင်ရာ နောက်ဆုံးပေါ် သုတေသနရလဒ်များကို မျှဝေခဲ့သည်။ GQA နှင့် MQA တို့ကို ပိုမိုကောင်းမွန်အောင်ပြုလုပ်ခြင်း မဟာဗျူဟာနှစ်ခုကို အကောင်အထည်ဖော်ခြင်းဖြင့်၊ ကုဒ်ဝှက်ခြင်းအဆင့်ရှိ Transformer ၏ I/O ပိတ်ဆို့မှုပြဿနာကို ထိထိရောက်ရောက်ဖြေရှင်းနိုင်သည်၊ ထို့ကြောင့် အနုမာနထိရောက်မှုကို တိုးတက်စေသည်ဟု သူအဆိုပြုခဲ့သည်။