Amazon AWS slipper Inferentia 2-brikken for å akselerere storskala modellslutninger

31
Amazon AWS slipper Inferentia 2-brikken, som tredobler dataytelsen og øker det totale akseleratorminnet med en fjerdedel. Inferentia 2 støtter distribuert resonnement og kan støtte opptil 175 milliarder parametere, noe som gjør den til en sterk konkurrent for storskala modellresonnering.