Baichuan Intelligent uvádza novú stratégiu pre optimalizáciu účinnosti transformátora

2024-12-27 06:16
 74
Wang Bingning, vedúci predbežného školenia v Baichuan Intelligence, sa podelil o najnovšie výsledky výskumu o optimalizácii účinnosti transformátora na „Globálnej konferencii o technológii strojového učenia 2024“. Navrhol, že implementáciou dvoch optimalizačných stratégií, GQA a MQA, je možné efektívne vyriešiť problém I/O úzkych miest transformátora v štádiu dekódovania, čím sa zlepší účinnosť odvodenia.