Amazon AWS uvádí na trh čip Inferentia 2, který urychluje odvození modelů ve velkém měřítku

31
Amazon AWS uvádí na trh čip Inferentia 2, který ztrojnásobuje výpočetní výkon a zvyšuje celkovou paměť akcelerátoru o čtvrtinu. Inferentia 2 podporuje distribuované uvažování a může podporovat až 175 miliard parametrů, což z něj dělá silného konkurenta pro uvažování ve velkém měřítku.