Le SSD orienté IA est très populaire

MSN - 28/04
Les SSD orientés IA sont entrés dans le carnaval de l'industrie.

(L'auteur de cet article est Semiconductor Industry Zongheng, et Titanium Media le publie avec autorisation)

Texte | Industrie des semi-conducteurs verticale et horizontale

Alors que la puissance de calcul des GPU double chaque trimestre et que le HBM devient la « monnaie forte » des serveurs d’IA, un composant central sérieusement sous-estimé – le SSD optimisé pour les charges de travail d’IA – se trouve au centre des conflits de l’industrie. Les solutions de stockage actuellement dominantes sur le marché, HDD et HBM, ont chacune des contraintes de développement difficiles à surmonter, ce qui est la principale raison de cette situation.

HBM et HDD ne sont pas des solutions optimales

Regardons d'abord HBM. Avec la croissance explosive de la puissance de calcul des GPU, il s’agit essentiellement d’une amélioration exponentielle des « capacités de traitement des données ». D'une seule carte à un cluster, de dizaines de milliards de paramètres à des milliards de paramètres, les « exigences de débit » du GPU pour les données ne feront que devenir de plus en plus exigeantes : non seulement il doit être rapide, mais il doit également être stable et sans retard pour éviter « la puissance de calcul au ralenti ». Cette demande touche tout simplement le point sensible des solutions de stockage existantes. Deuxièmement, le HBM est devenu une « monnaie forte » et le choix passif du marché pour le « stockage à large bande passante ». Le principal avantage de HBM est « une bande passante proche du niveau de la mémoire », qui peut correspondre au maximum au rythme de calcul à grande vitesse du GPU et réduire le délai de transfert de données - c'est également la clé pour qu'il devienne la configuration standard des serveurs d'IA. Cependant, la logique de coût du HBM est contraire au « déploiement à grande échelle ». Une dépendance excessive à l’égard de HBM augmentera directement le coût global des serveurs d’IA, ce qui l’empêchera de fonctionner pour la plupart des entreprises.

Examinons le disque dur, une autre solution de stockage grand public. En tant qu'« acteur de capacité » qui occupe depuis longtemps le marché du stockage, les avantages du disque dur sont son faible coût et sa grande capacité, qui peuvent répondre aux besoins d'archivage de données, de stockage frigorifique et d'autres scénarios. Cependant, à mesure que la puissance de calcul de l'IA augmente, les défauts de performances du disque dur sont devenus un « défaut fatal » : sa structure mécanique détermine la vitesse de lecture et d'écriture et les performances de latence, et ne peut pas suivre le rythme de libération de la puissance de calcul du GPU. Dans la formation à l'IA, les données doivent être rapidement chargées du support de stockage vers la mémoire GPU, et la réponse lente du disque dur entraînera des « données en attente de puissance de calcul ».

On voit que le cœur de la contradiction industrielle est très clair : la « demande infinie de puissance de calcul » des GPU et « l'adaptabilité limitée » des solutions de stockage existantes forment une nette opposition. HBM peut résoudre le problème...
[Courte citation de 8% de l'article original]

Loading...