Amazon AWS merilis chip Inferentia 2 untuk mempercepat inferensi model skala besar-Redplanx

Amazon AWS merilis chip Inferentia 2 untuk mempercepat inferensi model skala besar

meter meningkatkan rem besar meningkatkan busi akselerator besar skala

2024-12-26 07:13

Amazon AWS merilis chip Inferentia 2, yang melipatgandakan kinerja komputasi dan meningkatkan total memori akselerator hingga seperempatnya. Inferentia 2 mendukung penalaran terdistribusi dan dapat mendukung hingga 175 miliar parameter, menjadikannya pesaing kuat untuk penalaran model skala besar.

Prev：Amazon AWS ປ່ອຍຊິບ Inferentia 2 ເພື່ອເລັ່ງການ inference ຮູບແບບຂະຫນາດໃຫຍ່

Next：Amazon AWS mengeluarkan cip Inferentia 2 untuk mempercepatkan inferens model berskala besar