亚马逊AWS发布Inferentia 2芯片，加速大规模模型推理-智能汽车产业链平台-红色星际

亚马逊AWS发布Inferentia 2芯片，加速大规模模型推理

AWS 推理芯片性能亚马逊竞争模型内存分布式大规模加速器规模

2024-03-15 18:06

亚马逊AWS发布Inferentia 2芯片，将计算性能提高三倍，加速器总内存提高四分之一。Inferentia 2支持分布式推理，最多可支持1750亿个参数，成为大规模模型推理的有力竞争者。