Groq stor modell inferensbrikke har utmerket ytelse og bruker bare en tidel av strømforbruket til NVIDIA GPU-Redplanx

Groqs store modellinferensbrikke foreslår LPU-løsningen (Language Processing Unit) for første gang i verden, som er en Tensor Streaming Processor (TSP)-brikke basert på TSA-arkitekturen. Selv om Groqs LPU ikke bruker dyr banebrytende prosessteknologi, men velger 14nm-prosessen, er ytelsen fortsatt utmerket, og gir opptil 1000 TOPS datakraft, og ytelsen på noen maskinlæringsmodeller er bedre enn konvensjonelle GPUer og TPU har blitt forbedret med 10 til 100 ganger. I tillegg er energiforbruket til Groq LPU-brikker bare en tidel av Nvidia GPU-er.