Amazon AWS lança chip Inferentia 2 para acelerar inferência de modelos em grande escala-Redplanx

Amazon AWS lança chip Inferentia 2 para acelerar inferência de modelos em grande escala

AWS O um raciocínio desempenho Amazon metro distribuído acelerador escala memória

2024-12-26 07:13

Amazon AWS lança chip Inferentia 2, que triplica o desempenho da computação e aumenta a memória total do acelerador em um quarto. O Inferentia 2 suporta raciocínio distribuído e pode suportar até 175 bilhões de parâmetros, tornando-o um forte concorrente para raciocínio de modelo em larga escala.

Prev：Amazon AWS lance la puce Inferentia 2 pour accélérer l'inférence de modèles à grande échelle

Next：Amazon AWS julkaisee Inferentia 2 -sirun nopeuttaakseen laajamittaisten mallien päättelyä