Groq大模型推理晶片效能卓越,功耗僅為英偉達GPU的十分之一

48
Groq的大模型推理晶片在全球首次提出了LPU(Language Processing Unit)解決方案,這是一款基於TSA架構的Tensor Streaming Processor (TSP) 晶片。儘管Groq的LPU並未採用昂貴的尖端製程工藝,而是選擇了14nm過程,但其性能表現依然出色,提供了高達1000 TOPS的計算能力,在某些機器學習模型上的性能表現比常規GPU和TPU提升了10到100倍。此外,Groq LPU晶片的能耗僅為英偉達GPU的十分之一。