Amazon Web Services (AWS) propose désormais des « AI Factories » – des systèmes d’IA entièrement gérés qui s’exécutent à l’intérieur des centres de données d’entreprise et gouvernementaux. Cette décision remet directement en question la domination des services d’IA dans le cloud public et exploite les préoccupations croissantes concernant la sécurité et le contrôle des données.
Pourquoi c’est important : la souveraineté des données à l’ère de l’IA
Les entreprises et les gouvernements hésitent de plus en plus à envoyer des données sensibles à des fournisseurs d’IA externes. Le risque de fuite de données, d’espionnage concurrentiel ou même d’accès étranger hostile stimule la demande de solutions dans lesquelles les données ne quittent jamais les locaux du client. AWS, comme Microsoft, répond essentiellement en fournissant l’infrastructure d’IA directement au client.
Comment fonctionnent les usines d’IA : une approche hybride
Ces usines d’IA sont construites en collaboration avec Nvidia, exploitant leurs GPU hautes performances (y compris la dernière série Blackwell) ainsi que les propres puces AI Trainium3 d’Amazon. Les clients fournissent l’infrastructure physique (le centre de données, l’alimentation et le refroidissement), tandis qu’AWS gère les logiciels, la gestion et l’intégration avec d’autres services cloud.
Les composants clés comprennent :
- Réseau et stockage AWS : Se connecte de manière transparente aux écosystèmes AWS existants.
- Amazon Bedrock : Offre un accès à un marché organisé de modèles d’IA.
- AWS SageMaker : Permet la création et la formation de modèles personnalisés.
Stratégie parallèle de Microsoft : superfactories et Azure Local
Amazon n’est pas seul dans cette démarche. Microsoft déploie une infrastructure d’IA similaire dans ses propres centres de données (surnommés « AI Superfactories ») depuis fin 2023, avec l’intention de se développer à l’échelle mondiale. Ils proposent également « Azure Local », une solution matérielle entièrement gérée qui peut être installée sur les sites des clients.
Cette tendance est remarquable car elle représente un renversement de direction dans l’industrie du cloud. Pendant des années, l’accent a été mis sur la centralisation de la puissance de calcul dans des cloud publics massifs. Aujourd’hui, l’IA suscite un regain d’intérêt pour les déploiements privés et hybrides.
L’ironie : les géants du cloud reconstruisent leurs cloud privés
L’ironie est frappante : les mêmes fournisseurs de cloud qui ont perturbé les centres de données traditionnels investissent désormais massivement pour leur redonner le calcul de l’IA. Ce changement fait écho aux débuts du cloud computing, lorsque les entreprises se sont prudemment lancées dans les cloud privés avant d’adopter pleinement les services publics.
La demande de solutions d’IA sur site prouve que le contrôle des données est une priorité absolue, même au détriment de la commodité et du coût. Cette tendance suggère que les déploiements d’IA hybrides et privés deviendront de plus en plus courants dans les années à venir.
