L'IA change d'échelle et impose de repenser les infrastructures - ZDNET

Roch Arene - ZDNet - 29/09
Rick Moore, responsable de l’innovation chez Digital Realty, estime que l’industrie de l’intelligence artificielle entre dans une nouvelle ère : celle de l’inférence. Face à cette mutation, les centres de données doivent repenser leurs infrastructures pour répondre aux besoins croissants.

Le secteur de l’intelligence artificielle évolue rapidement. Après une phase consacrée à la formation de modèles, place désormais à l’inférence, c’est-à-dire au traitement en temps réel des requêtes des utilisateurs. « Le processus d’inférence devra gérer beaucoup plus de demandes que la formation », explique Rick Moore. « À mesure que l’IA agentique se déploie, des millions d’inférences se produiront chaque jour. »

Cette transition impose une refonte des stratégies d’infrastructure. Contrairement à l’apprentissage, qui repose sur des calculs planifiés, l’inférence génère des charges de travail imprévisibles et irrégulières.

Pour Moore, les data centers doivent s’adapter : « Les environnements inférentiels exigent une alimentation électrique à haute densité, des systèmes de refroidissement performants et des réseaux à faible latence. » Digital Realty multiplie ainsi ses investissements dans des infrastructures spécifiquement conçues pour l’inférence, afin d’assurer une exploitation stable et rentable des applications d’IA générative.

  • Mastodon refuse que des IA s'entra...
    [Courte citation de 8% de l'article original]
Loading...