Η Baichuan Intelligent κυκλοφορεί νέα στρατηγική για τη βελτιστοποίηση της απόδοσης του μετασχηματιστή

74
Ο Wang Bingning, επικεφαλής της προεκπαίδευσης στο Baichuan Intelligence, μοιράστηκε τα τελευταία ερευνητικά αποτελέσματα σχετικά με τη βελτιστοποίηση της απόδοσης του μετασχηματιστή στο "2024 Global Machine Learning Technology Conference". Πρότεινε ότι με την εφαρμογή δύο στρατηγικών βελτιστοποίησης, GQA και MQA, το πρόβλημα της συμφόρησης I/O του Transformer στο στάδιο της αποκωδικοποίησης μπορεί να λυθεί αποτελεσματικά, βελτιώνοντας έτσι την αποτελεσματικότητα των συμπερασμάτων.