Baichuan Intelligent Keluarkan Strategi Baharu untuk Pengoptimuman Kecekapan Transformer

2024-12-27 06:16
 74
Wang Bingning, ketua pra-latihan di Baichuan Intelligence, berkongsi hasil penyelidikan terkini mengenai pengoptimuman kecekapan Transformer pada "Persidangan Teknologi Pembelajaran Mesin Global 2024". Beliau mencadangkan bahawa dengan melaksanakan dua strategi pengoptimuman, GQA dan MQA, masalah kesesakan I/O Transformer dalam peringkat penyahkodan boleh diselesaikan dengan berkesan, sekali gus meningkatkan kecekapan inferens.