淺談數(shù)據(jù)中心液冷
數(shù)據(jù)中心液冷技術(shù)是解決高密度算力散熱難題的關(guān)鍵方案,尤其在AI、云計算和超算場景中逐步成為主流。
液冷技術(shù)的分類與原理
冷板式液冷(間接液冷)
原理:通過金屬冷板直接接觸CPU/GPU等發(fā)熱部件,液體在冷板內(nèi)部流動帶走熱量。
優(yōu)勢:兼容現(xiàn)有服務(wù)器架構(gòu),改造成本低,適合局部高熱部件散熱。
浸沒式液冷(直接液冷)
原理:將服務(wù)器完全浸沒在絕緣冷卻液中(如氟化液或礦物油),通過液體沸騰/循環(huán)散熱。
優(yōu)勢:散熱效率提升50倍,支持單機(jī)柜100kW以上功率密度,噪音降低90%。
噴淋式液冷
原理:精準(zhǔn)噴射冷卻液至熱源表面,通過蒸發(fā)吸熱。
優(yōu)勢:靈活適配異構(gòu)計算設(shè)備,適合邊緣數(shù)據(jù)中心。
從國內(nèi)的液冷市場來說,冷板式液冷(間接液冷)目前是市場的主流方式。具體原因?yàn)?,系統(tǒng)簡潔,操作簡單,維護(hù)方便,同時冷卻速率能滿足目前算力的要求。冰河冷媒的水基冷卻液具有較高的導(dǎo)熱系數(shù),具有較多的應(yīng)用案例,防腐性能優(yōu)秀,是冷板系統(tǒng)的一個優(yōu)選冷媒。根據(jù)多個數(shù)據(jù)中心的運(yùn)行數(shù)據(jù)分析,PUE的運(yùn)行值一般在1.1~1.2之間,跟室外換熱側(cè)是能耗的重點(diǎn)區(qū),運(yùn)行過程需要進(jìn)行調(diào)節(jié),超過1.2的此系統(tǒng)可以尋找可以節(jié)能的點(diǎn)。
隨著數(shù)據(jù)中心算力的提升,冷卻需求會越來越高,冷板的上限必然不能滿足要求,因此需要浸沒式液冷(直接液冷),相變液冷:細(xì)分析主要原因是冷卻過程為沸騰換熱,傳熱系數(shù)高于液體對流,同時沸騰過程液體溫度不變,通過相變潛熱帶走大量熱量。非相變液冷:通過液體浸泡芯片,循環(huán)液體通過冷媒的溫差帶走熱量,換熱量有限,直接接觸式有一定的電導(dǎo)率和擊穿電壓要求,主要產(chǎn)品為油基冷媒,導(dǎo)熱系數(shù)低,比熱小,服務(wù)器機(jī)柜的流通面積大,芯片表面冷媒流動速度小,實(shí)際換熱效果甚至不如冰河冷媒冷板換熱系統(tǒng)。因此浸沒式液冷相變換熱系統(tǒng)是未來的方向。通過市場的應(yīng)用案例分析,相變液冷的PUE在1~1.15之間。這個PUE范圍較寬,在1.1以內(nèi)主要是一些輸送范圍小,尤其是單體設(shè)備的系統(tǒng),例如集裝箱式,輸送能耗低,甚至可以靠芯片的熱驅(qū)動運(yùn)行,PUE可以 做到1.05以內(nèi)。
噴淋式液冷目前主要以油基冷媒為主,整體PUE跟直接浸沒液冷相似。但對設(shè)備分液要求較高,要預(yù)防死區(qū),造成設(shè)備燒毀故障。從傳熱學(xué)角度看,噴淋的液體更爆,換熱熱阻小,換熱能力強(qiáng),理論換熱效率會高。尤其采用相變式換熱冷媒,膜態(tài)沸騰,傳熱系數(shù)更高,但目前的技術(shù)和思路并沒有發(fā)展到這塊。因此這個不是一個主流發(fā)展方向。有感興趣的機(jī)構(gòu)可以嘗試,相變噴淋液冷效率比浸末相變效率更高。
數(shù)據(jù)中心液冷形式多樣化,但每一種系統(tǒng)都有存在的合理性。因此PUE的高低更多的是落在了數(shù)據(jù)中心后期的運(yùn)營上,需要懂系統(tǒng),優(yōu)化節(jié)能運(yùn)營思路。發(fā)揮系統(tǒng)最優(yōu)的狀態(tài)。