Amazon AWS izda čip Inferentia 2 za pospešitev sklepanja o modelih velikega obsega

2024-12-26 07:13
 31
Amazon AWS izda čip Inferentia 2, ki potroji računalniško zmogljivost in poveča skupni pomnilnik pospeševalnika za četrtino. Inferentia 2 podpira porazdeljeno sklepanje in lahko podpira do 175 milijard parametrov, zaradi česar je močan tekmec za sklepanje obsežnih modelov.