La puce IA d'Amazon Inferentia pourrait réduire les coûts d'exploitation de 40 %

69
Amazon a déclaré avoir réduit les coûts d'exploitation de 40 % sur son autre puce d'IA professionnelle, « Inferentia », utilisée pour générer des réponses à partir de modèles d'IA. « Lorsque nous parlons d'apprentissage automatique et d'intelligence artificielle, le cloud computing a tendance à être beaucoup plus cher », a déclaré Dave Brown, vice-président des services de calcul et de réseau chez AWS. « Lorsque vous économisez 40 % sur 1 000 $, cela n'a pas vraiment d'impact. vous avez le choix. Mais lorsque vous économisez 40 % de dizaines de millions de dollars, cela affecte votre choix.