Le secteur de l’intelligence artificielle évolue rapidement. Après une phase consacrée à la formation de modèles, place désormais à l’inférence, c’est-à-dire au traitement en temps réel des requêtes des utilisateurs. « Le processus d’inférence devra gérer beaucoup plus de demandes que la formation », explique Rick Moore. « À mesure que l’IA agentique se déploie, des millions d’inférences se produiront chaque jour. »
Cette transition impose une refonte des stratégies d’infrastructure. Contrairement à l’apprentissage, qui repose sur des calculs planifiés, l’inférence génère des charges de travail imprévisibles et irrégulières.
Pour Moore, les data centers doivent s’adapter : « Les environnements inférentiels exigent une alimentation électrique à haute densité, des systèmes de refroidissement performants et des réseaux à faible latence. » Digital Realty multiplie ainsi ses investissements dans des infrastructures spécifiquement conçues pour l’inférence, afin d’assurer une exploitation stable et rentable des applications d’IA générative.