2023年度液冷基礎設施市場份額達到61.3%,連續(xù)3年蟬聯行業(yè)榜首,根據《液冷數據中心白皮書》
,曙光數創(chuàng)再次交出亮眼成績單
。
智算快速發(fā)展環(huán)境下
,其實不止曙光數創(chuàng)
,整個行業(yè)的液冷正呈現高速發(fā)展態(tài)勢。
曙光數創(chuàng)副總裁兼CTO張鵬博士在接受采訪時預測:“液冷整體滲透率目前并不高
,不超過10%
,但未來3到5年這個比例將快速提高,有望達到30%甚至40%
?div id="jfovm50" class="index-wrap">!薄吨袊豪鋽祿行氖袌錾疃妊芯繄蟾妗芬诧@示,目前中國液冷數據中心市場快速發(fā)展
,預計到2027年
,液冷市場將以60%的復合增長率,突破千億規(guī)模
。
液冷的兩種主要技術路線——冷板式與浸沒式的發(fā)展趨勢如何,目前挑戰(zhàn)是什么,如何應對等成為行業(yè)熱議話題
。
液冷是高效散熱必需,
真正價值是激活芯片計算潛能
大模型等人工智能快速發(fā)展下,智算產業(yè)迅速拓展
,據中國信通院統(tǒng)計
,截至2023年底,我國智算規(guī)模約69 EFLOPS
,相較于2023年6月的50EFLOPS
,半年時間規(guī)模增加38%,但在推動數據中心產業(yè)的同時
,也給數據中心散熱帶來巨大挑戰(zhàn)
。
GPU芯片功率不斷提升,高密度成為發(fā)展趨勢
。風冷有其制冷極限
,無法滿足服務器及數據中心的散熱要求,而同體積液體帶走的熱量是同體積空氣的3000倍以上
,能夠高效降溫
,保證芯片的安全運行。因此
,
液冷被公認為是算力基礎設施的標配與必然選擇。
在此基礎上,液冷應用的成本不斷降低
。張鵬表示
,
經過測算,當數據中心機架部署密度超過10kW后,冷板式液冷系統(tǒng)的初始投資已經低于風冷
,并且隨著運行時間的增長,TCO(總體擁有成本)優(yōu)勢會更為明顯
。
液冷還能夠促進節(jié)能減碳,其高效率制冷的能力可大幅度減少散熱的電能消耗,讓數據中心實現低PUE
,符合政策要求與綠色化發(fā)展趨勢
。
尤為值得注意的是,液冷能夠激活計算的潛能,這也是其真正價值所在
。張鵬指出,GPU頻率是可變的
,如果制冷能力不足
,為了安全穩(wěn)定的運行,GPU就需要降頻
,而這就影響了計算能力
。換句話說,
散熱能力差束縛了芯片算力的輸出。液冷可高效地解決這一問題
,確保芯片計算能力的全火力輸出?div id="jfovm50" class="index-wrap">!?strong style="background-repeat:no-repeat;">以某國產CPU芯片為例
,風冷條件下2.4GHz的CPU在相變浸沒液冷環(huán)境下主頻可達到3.2GHz,處理速度提升超過30%
!”張鵬說
。
這些均推動了液冷應用的快速發(fā)展
,行業(yè)客戶逐步增多,包括互聯網
、運營商
、金融等,同時
,
相較于改造 ,目前液冷的使用主要以新增的數據中心為主。張鵬表示
,改造面臨很多現實問題
,如維保需要結合數據中心現有情況提供更完善的方案,可靠性需進行綜合考量
;如服務器有著一定的使用年限
,改造投入后,企業(yè)收益能否覆蓋成本
、滿足商業(yè)需要也存在一定疑慮
。
冷板式是當前主流,浸沒式未來將廣泛應用
面向大模型的智算需求
,為釋放芯片算力
,液冷已經成為大趨勢。從目前應用情況來看
,冷板式是液冷主流
。張鵬指出,
目前冷板式在液冷市場約占大概80%到90%,這是因為冷板式的成本更低
,產業(yè)鏈也更為成熟,同時
,冷板式與風冷在運維上差異較小
,使用習慣一致,市場接受程度更高
。
與之相對應的
,浸沒式的運維邏輯不同,比如風冷中沒有換液等運維步驟
,考慮到浸沒式的成本與后續(xù)運維
,張鵬直言,目前小型數據中心不推薦上浸沒式
,大型數據中心可以承擔較多的成本壓力
,還可配置專門的液冷運維操作間,更適宜使用浸沒式
。
不過這并不代表浸沒式“止步于此”
,
伴隨著芯片功率的提升,冷卻效率還要進一步提升,這將推動浸沒式 ,準確地說是加快相變浸沒式的廣泛應用
。
據了解,國內CPU芯片功率已經達到400W
,而英偉達2024年3月最新推出的B200芯片相比H100雖然算力能源效率提升了約25倍,但芯片功耗也將超過1000W
。張鵬表示
,
相變浸沒式的冷卻效率要高于冷板式與單相浸沒式,更適合高功率的芯片散熱需求 ,或是終極液冷出路
。
不僅如此,相較于冷板式
,浸沒式還有多項優(yōu)勢
。如
浸沒式是一站式解決方案,可靠性高 ,對環(huán)境的依賴性小
,能夠很好的防潮防塵。同時
,在服務器更新的時候
,強耦合的冷板式也會被替換,浸沒式則只需要替換冷媒
,這使得在成本方面浸沒式也會逐步顯示出優(yōu)勢
。
浸沒式應用推廣面臨多項挑戰(zhàn),需要從技術 、生產等方面優(yōu)化
技術的大規(guī)模應用轉化需要成熟的技術與產業(yè)鏈的支撐
,液冷同樣如此。
具體來看
,
冷板式在技術上已經實現了多項突破,目前面臨的挑戰(zhàn)主要是產業(yè)鏈方面的,包括如何推動產品的成熟
,更好的降本增效
,提升可靠性等,這意味著整個行業(yè)的發(fā)展
,也是挑戰(zhàn)
。
浸沒式則處于技術創(chuàng)新突破的時期,其技術門檻極高,目前依舊有多項技術問題沒有解決,且并非短時間內就可以解決。
這點從曙光數創(chuàng)的發(fā)展便能體現出來,自2011年提出液冷技術路線并啟動相關技術研究,到2017年浸沒式液冷才對外應用,曙光數創(chuàng)歷經6年才實現了浸沒技術的商用化,這其中有多項關鍵技術的突破
。
以浸沒冷媒為例
,經過長期自主研發(fā),
曙光浸沒相變液冷計算機所使用的冷媒——電子氟化液已經迭代到第三代,實現了諸多創(chuàng)新,具有高絕緣、低沸點、大潛熱、穩(wěn)定性高、低粘度、安全性、以及環(huán)境友好(無臭氧破壞、溫室效應低)等特性,可支持浸沒相變液冷系統(tǒng)生命周期內可靠穩(wěn)定運行。
也正是依托技術上的長期研發(fā)突破,曙光數創(chuàng)的相變浸沒液冷才能夠不斷應用推廣 ,成為目前國內唯一實現全浸式液體相變冷卻大規(guī)模商業(yè)化部署的企業(yè)
,在重慶和多個東部一二線城市均有相變浸沒式數據中心的建設實踐。
面對未來更高功率的散熱要求
,針對不同產業(yè)的差異化需求
,
浸沒式技術還要進行更深入的發(fā)展,需要企業(yè)從多方面來進行優(yōu)化。
首先,需要大量的研發(fā)投入。以曙光數創(chuàng)為例
,其以技術為導向
,持續(xù)研發(fā)投入,根據財報來看
,2023年研發(fā)投入共計6825.33萬元
,2024年第一季度研發(fā)費用總額超1440萬元,相較于2023年第一季度同比增長超過4%
。通過大量的研發(fā)投入
,曙光數創(chuàng)有效優(yōu)化了液冷散熱技術,實現了高效可靠的全棧基礎設施解決方案全場景覆蓋
。截至2023年末
,曙光數創(chuàng)擁有已授權相關專利135項,包含發(fā)明專利38項
,軟著45項
,其中與液冷相關的專利104項,軟著27項
,在審發(fā)明專利31項
。
其次,需要為生產做好準備
。如曙光數創(chuàng)在山東青島建設了目前我國規(guī)模最大的液冷數據中心全鏈條產業(yè)創(chuàng)新基地
,且已正式投產。該基地囊括研發(fā)
、生產和保障三大功能區(qū),擁有七大研發(fā)創(chuàng)新實驗室和四條先進生產線
,實現專業(yè)的全鏈條
、一站式系統(tǒng)解決方案的創(chuàng)新研發(fā)和生產,能夠有效降本增效
,提升交付能力
,提高保密性,推動生產發(fā)展
。
最后,需要時刻跟隨客戶需求。不同的企業(yè)在應用液冷的過程中有差異化需求
,如金融業(yè)對安全性的高要求
,要求液冷廠商能夠依托自身技術與產品持續(xù)優(yōu)化發(fā)展,以更契合客戶的發(fā)展需要
,促進算力的有效供給
。
綜合來看,液冷是智算快速發(fā)展趨勢下散熱的標配與必需品
,能夠有效釋放芯片的計算能力
,并且伴隨芯片功率的持續(xù)提升,液冷未來的發(fā)展方向是浸沒式
,但浸沒式目前在技術與產業(yè)發(fā)展上依舊存在諸多挑戰(zhàn)
,需要圍繞客戶需求,加大研發(fā)投入
,完善產業(yè)鏈做好生產準備
,最終滿足不同客戶對液冷的差異化需求,推動算力建設,加快智能化
、
數字化發(fā)
Copyright ?英和數據 版權所有
蘇ICP備2022020863號
咨詢熱線:
0510-68186618
電 話:0510-68186618、68186628
地 址:無錫市梁溪區(qū)人民西路98號12樓