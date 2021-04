Microsoft expérimente une nouvelle technique de refroidissement liquide dans son data center de Quincy, situé sur la rive orientale du fleuve Columbia, dans l'État de Washington. Dans un billet de blog publié le 6 avril, l’entreprise explique avoir mis au point et testé une technique de refroidissement par immersion à deux phases, et ce dans un environnement de production. Elle déclare être le premier acteur du cloud à l'avoir fait.



Refroidissement par ébullition

Concrètement, il s'agit d'un système de refroidissement liquide en boucle fermée. Les serveurs sont plongés dans un liquide qui est porté à ébullition à 50 °C, soit deux fois moins de chaleur que pour l'eau, ce qui lui permet de s'évaporer avant que les serveurs ne surchauffent. Le liquide en question a été conçu par 3M. Contrairement à l’eau, il est inoffensif pour les équipements car il a des propriétés diélectriques qui en font un isolant efficace. Ils peuvent donc fonctionner sans problème en baignant dedans.



Les serveurs sont placés dans un caisson "en forme de canapé". Lorsque le liquide est chauffé et porté à ébullition au contact des composants, de la vapeur s’échappe et entre en contact avec un condenseur situé dans le couvercle du caisson. Le liquide retombe alors comme une pluie sur les serveurs immergés et les refroidit. Cela en fait un circuit fermé. Le condenseur est lui-même raccordé à un second circuit fermé qui utilise aussi un liquide pour transférer la chaleur à un refroidisseur à sec situé en dehors du caisson.



L'ébullition à basse température permet aux serveurs de fonctionner en continu à pleine puissance sans risque de panne due à une surchauffe. Microsoft, deuxième plus grand opérateur cloud au monde derrière AWS, s'y est intéressé en voyant ce qu'en faisant certains mineurs de cryptomonnaies. Il cherche de son côté à s'en servir pour d'autres applications de calcul haute performance (HPC), notamment liées à l'intelligence artificielle.







de 5% à 15% de gains de consommation énergétique

Le refroidissement des data centers est une problématique majeure à l'échelle dite "hyper scale" d'un opérateur cloud. Tous les acteurs du secteur cherchent à réduire au maximum la consommation énergétique liée au refroidissement (qui dépasse largement celle des serveurs eux-mêmes), mais ils doivent également permettre augmenter en permanence la puissance de calcul disponible et limiter les pannes matérielles.



Alors que les techniques de refroidissement par air ne suffisent plus et que la demande en puissance de calcul s'accélère, "le refroidissement liquide nous permet de densifier nos infrastructures et donc de poursuivre la tendance de la loi de Moore à l'échelle d'un centre de données", explique Christian Belady, vice-président du groupe de développement avancé des data centers de Microsoft. En l'occurrence, lors de ces tests les chercheurs ont constaté une réduction de la consommation des serveurs comprise entre 5 et 15%.



Ce chiffre est d’autant plus prometteur que le projet Natick, lors duquel Microsoft a immergé des serveurs au fond de la mer, a connu un taux de défaillance huit fois moins élevé que pour les data centers terrestres habituels. Une performance liée au fait que leur caisson était rempli d'azote pur et sec au lieu de l'air ambiant. L’absence d’humidité et des effets corrosifs de l’oxygène serait en cause. L’équipe prévoit des performances similaires pour cette méthode de refroidissement par immersion.







Des serveurs overclockables sans risque

Pour Marcus Fontoura, Chief architect d'Azure Compute chez Microsoft, l'un des avantages de cette technique de refroidissement à deux niveaux est d'avoir plus de souplesse pour gérer les pics de calcul. Lorsqu'un data center dispose de caissons de ce type, il peut y allouer les demandes lors d'une augmentation soudaine car ces derniers peuvent être overclockés sans risquer de surchauffer.



Il donne l'exemple des visioconférences en période de pandémie, où de nombreux salariés travaillent de chez eux et les connexions vidéo se font en rafale. "Nous savons qu'avec Teams, lorsque vous arrivez à 13h ou 14h, il y a un énorme pic parce que les gens rejoignent les réunions en même temps", détaille Marcus Fontoura.



Déploiement dans des zones difficiles d'accès

Si les études confirment que les cas de défaillance sont faibles, Microsoft souhaite plancher sur un modèle où les composants ne seront pas immédiatement remplacés lorsqu'ils tomberont en panne afin de limiter les pertes de vapeur. L'étape suivante sera de déployer des caissons de ce type dans des endroits éloignés et difficiles à desservir. "Cette première étape vise à mettre les gens à l'aise avec le concept et à montrer que nous pouvons exécuter des charges de travail de production", explique Christian Belady. Parmi les exemples donnés, un caisson pourrait être déployé sous une tour de communication cellulaire 5G au milieu d'une ville pour des applications telles que les voitures autonomes.