Amazon AWS lansează cip Inferentia 2 pentru a accelera inferența modelelor la scară largă

31
Amazon AWS lansează cip Inferentia 2, care triplează performanța de calcul și mărește memoria totală a acceleratorului cu un sfert. Inferentia 2 acceptă raționamentul distribuit și poate suporta până la 175 de miliarde de parametri, făcându-l un concurent puternic pentru raționamentul pe modele la scară largă.