Amazon AWS пуска чип Inferentia 2, за да ускори широкомащабното извеждане на модела

2024-12-26 07:13
 31
Amazon AWS пуска чип Inferentia 2, който утроява изчислителната производителност и увеличава общата памет на ускорителя с една четвърт. Inferentia 2 поддържа разпределени разсъждения и може да поддържа до 175 милиарда параметъра, което го прави силен конкурент за разсъждения в широкомащабни модели.