Amazon AWS เปิดตัวชิป Inferentia 2 เพื่อเร่งการอนุมานโมเดลขนาดใหญ่

2024-12-26 07:13
 31
Amazon AWS เปิดตัวชิป Inferentia 2 ซึ่งเพิ่มประสิทธิภาพการประมวลผลสามเท่าและเพิ่มหน่วยความจำตัวเร่งทั้งหมดขึ้นหนึ่งในสี่ Inferentia 2 รองรับการให้เหตุผลแบบกระจายและสามารถรองรับพารามิเตอร์ได้มากถึง 175 พันล้านพารามิเตอร์ ทำให้กลายเป็นคู่แข่งที่แข็งแกร่งสำหรับการใช้เหตุผลแบบจำลองขนาดใหญ่