Amazon AWS, 대규모 모델 추론을 가속화하기 위해 Inferentia 2 칩 출시-Redplanx

Amazon AWS, 대규모 모델 추론을 가속화하기 위해 Inferentia 2 칩 출시

팔콘 시리즈 공다전자음향 가속 지원 지원 칩 칩 성능 성능 원 매 배 모델 메모리 분산 메모리 규모 메모리 메모리 의

2024-12-26 07:13

31

Amazon AWS는 컴퓨팅 성능을 3배로 늘리고 총 가속기 메모리를 1/4로 늘리는 Inferentia 2 칩을 출시합니다. Inferentia 2는 분산 추론을 지원하고 최대 1,750억 개의 매개변수를 지원할 수 있어 대규모 모델 추론의 강력한 경쟁자입니다.

Prev：Amazon AWS が大規模モデル推論を高速化する Inferentia 2 チップをリリース

Next：Amazon AWS нь том хэмжээний загварын дүгнэлтийг хурдасгахын тулд Inferentia 2 чипийг гаргасан