百川智能发布Transformer效率优化新策略
I/O
Transformer
百川智能
推理
训练
研究
优化
预训练
负责人
全球
机器
效率
2024-11-28 15:41
74
百川智能的预训练负责人王炳宁在“2024全球机器学习技术大会”上,分享了关于Transformer效率优化的最新研究成果。他提出,通过实施GQA和MQA两种优化策略,可以有效解决Transformer在解码阶段的I/O瓶颈问题,从而提升推理效率。
Prev:百辆JAC轻卡成功交付越南市场,深化与J&T Express的合作
Next:小马智行背后的明星团队
快报
一手资料
数据
个人中心