infrastructurePublié le 18 juin 20264 min de lecture

Graviton5 : AWS déploie son processeur maison pour l'ère des agents IA

AWS lance le Graviton5, son processeur Arm de nouvelle génération optimisé pour les agents IA. Les instances M9g et M9gd promettent jusqu'à 35 % de gains en inférence machine learning.

Graviton5 ديال AWS: معالج جديد للوكلاء الذكيين

L'infrastructure IA entre dans une nouvelle phase

Alors que l'IA générative cède progressivement la place aux agents autonomes capables d'orchestrer des tâches complexes, la bataille des infrastructures cloud s'intensifie. Amazon Web Services vient d'annoncer la disponibilité générale du Graviton5, son processeur Arm de nouvelle génération, à travers les instances Amazon EC2 M9g et M9gd.

Le CPU promet des gains de performance substantiels sur les workloads d'inférence, de génération de code et d'orchestration multi-étapes propres à l'IA agentique.

Une architecture repensée pour les agents IA

AWS a revu en profondeur l'architecture du processeur pour répondre aux contraintes spécifiques des agents IA. Ces systèmes exigent des traitements parallèles massifs, une latence minimale et une bande passante mémoire élevée.

Le processeur embarque 192 cœurs par puce, un cache cinq fois plus important que la génération précédente, ainsi que de la mémoire DDR5-8800 et une interface PCIe Gen 6. La réduction de la distance de transfert des données entre cœurs permet d'abaisser la latence jusqu'à 33 %.

Deux profils d'instances pour deux besoins

Les instances M9g ciblent les applications à forte intensité de calcul. Elles affichent jusqu'à 25 % de performances supplémentaires en traitement de calcul généraliste par rapport au Graviton4, avec des gains atteignant 35 % sur l'inférence machine learning et 30 % sur les bases de données.

Les instances M9gd s'adressent aux environnements nécessitant du stockage local rapide. Elles offrent jusqu'à 11,4 To de SSD NVMe et 30 % d'amélioration des performances d'entrées/sorties.

Une adoption déjà massive chez les grands comptes

Plus de 120 000 clients utilisent aujourd'hui des infrastructures basées sur Graviton. Meta a choisi d'intégrer plusieurs dizaines de millions de cœurs Graviton dans ses projets d'IA agentique, tandis qu'Uber et Snowflake s'appuient sur la plateforme pour leurs workloads associés.

Les retours des premiers testeurs du Graviton5 sont probants :

  • Airbnb relève jusqu'à 25 % de gain sur ses workloads de recherche par rapport aux architectures concurrentes de même génération
  • SAP mesure entre 35 % et 60 % d'amélioration sur les requêtes OLTP de SAP HANA Cloud
  • Synopsys, Siemens et Atlassian ont validé des gains significatifs dans leurs domaines respectifs

La sécurité comme argument différenciant

Les deux instances reposent sur la sixième génération du système AWS Nitro, complétée par un nouveau composant : le Nitro Isolation Engine. Ce module garantit l'isolation entre workloads par vérification mathématique formelle, une approche qui dépasse les mécanismes de cloisonnement logiciel traditionnels.

AWS y voit un argument de poids pour les environnements multi-tenant sensibles, où la cohabitation de charges de travail distinctes soulève des exigences de sécurité strictes.

Le CPU, nouvel enjeu stratégique

L'arrivée du Graviton5 illustre un glissement plus profond dans l'industrie : la compétition sur l'infrastructure IA ne se réduit plus à la seule course aux GPU. Latence d'inférence, efficacité énergétique, débit réseau et sécurité architecturale deviennent des critères différenciants à part entière.

AWS, en misant sur des puces maison, entend contrôler l'ensemble de la chaîne, du silicium aux instances cloud, pour offrir un rapport performance/coût que les solutions génériques peinent à égaler à mesure que les agents IA se généralisent.

Articles liés