Amazon AWS veröffentlicht den Inferentia 2-Chip, um groß angelegte Modellinferenzen zu beschleunigen-Redplanx

Amazon AWS veröffentlicht den Inferentia 2-Chip, um groß angelegte Modellinferenzen zu beschleunigen

Denken Sie an Technologie AWS Chip Chip Modell verteilt öffentlich Beschleuniger

2024-12-26 07:13

Amazon AWS veröffentlicht den Inferentia 2-Chip, der die Rechenleistung verdreifacht und den gesamten Beschleunigerspeicher um ein Viertel erhöht. Inferentia 2 unterstützt verteiltes Denken und kann bis zu 175 Milliarden Parameter unterstützen, was es zu einem starken Konkurrenten für groß angelegtes Modelldenken macht.

Prev：Amazon AWS нь том хэмжээний загварын дүгнэлтийг хурдасгахын тулд Inferentia 2 чипийг гаргасан

Next：Amazon AWS lance la puce Inferentia 2 pour accélérer l'inférence de modèles à grande échelle