Baichuan Intelligent သည် Transformer Efficiency Optimization အတွက် နည်းဗျူဟာအသစ်ကို ထုတ်ပြန်ခဲ့သည်။

2024-12-27 06:16
 74
Baichuan Intelligence မှ အကြိုလေ့ကျင့်ရေးမှူး Wang Bingning သည် "2024 Global Machine Learning Technology Conference" တွင် Transformer efficiency optimization ဆိုင်ရာ နောက်ဆုံးပေါ် သုတေသနရလဒ်များကို မျှဝေခဲ့သည်။ GQA နှင့် MQA တို့ကို ပိုမိုကောင်းမွန်အောင်ပြုလုပ်ခြင်း မဟာဗျူဟာနှစ်ခုကို အကောင်အထည်ဖော်ခြင်းဖြင့်၊ ကုဒ်ဝှက်ခြင်းအဆင့်ရှိ Transformer ၏ I/O ပိတ်ဆို့မှုပြဿနာကို ထိထိရောက်ရောက်ဖြေရှင်းနိုင်သည်၊ ထို့ကြောင့် အနုမာနထိရောက်မှုကို တိုးတက်စေသည်ဟု သူအဆိုပြုခဲ့သည်။