Amazon AWS пуска чип Inferentia 2, за да ускори широкомащабното извеждане на модела-Redplanx

Amazon AWS пуска чип Inferentia 2, който утроява изчислителната производителност и увеличава общата памет на ускорителя с една четвърт. Inferentia 2 поддържа разпределени разсъждения и може да поддържа до 175 милиарда параметъра, което го прави силен конкурент за разсъждения в широкомащабни модели.