Amazon AWS, 대규모 모델 추론을 가속화하기 위해 Inferentia 2 칩 출시
팔콘 시리즈
공다전자음향
가속
지원
지원
칩
칩
성능
성능
원
매
배
모델
메모리
분산
메모리
규모
메모리
메모리
2024-12-26 07:13
31
Amazon AWS는 컴퓨팅 성능을 3배로 늘리고 총 가속기 메모리를 1/4로 늘리는 Inferentia 2 칩을 출시합니다. Inferentia 2는 분산 추론을 지원하고 최대 1,750억 개의 매개변수를 지원할 수 있어 대규모 모델 추론의 강력한 경쟁자입니다.
Prev:Amazon AWS が大規模モデル推論を高速化する Inferentia 2 チップをリリース
Next:Amazon AWS нь том хэмжээний загварын дүгнэлтийг хурдасгахын тулд Inferentia 2 чипийг гаргасан
News
Exclusive
Data
Account