算力正在进入“基建化”的时代。
几年前的时候,每当电商大促、春晚红包等节点,宕机和救火几乎是从不缺席的戏份。近两年却是另一番景象:即便是在618大促这样的流量波峰,大多数电商平台都顶住了高并发的压力,背后离不开算力的迅猛增长。
正如中国信通院在一份研究报告中所揭示的:2016年到2020年期间,中国的算力规模平均每年增长42%,其中2020年的算力总规模已经达到135EFlops,并仍在保持55%的高速增长。
只是算力高速增长的同时,也带来了新的问题。
一、数据中心能耗占比分析
对于不少人来说,“计算”早已不是什么新概念。每一次打开“绿码”、每一次视频会议、每一次搜索点击……都离不开数据中心的处理计算。“计算”在日常生活中的无缝渗透,勾勒出了多彩的数字世界。
可当计算量越来越大,产生的功耗也随之增大。以全球最为知名的预训练大模型GPT-3为例,一次训练要消耗巨量的算力,需要消耗约19万度的电力,产生85万吨的二氧化碳,将其形容为“耗电怪兽”绝不为过。
倘若这些电力用在了“计算”本身,或许不是什么坏消息。毕竟在数字经济的时代,有一个著名的经济学解释,即算力上每投入一元,将带动3-4元的经济产出,“性价比”远高于传统的农牧业和工业生产。
现实的情况却并不乐观。根据开源证券研究所的统计结果,一个数据中心的能耗分布中,散热系统的占比高达40%。也就是说,数据中心每耗费一度电,只有一半用在了“计算”上,其他的则浪费在了散热、照明等方面。计算和散热几乎陷入了一场零和博弈,计算量越大散热消耗的电量越大,如果不消耗足够的能源提高散热能力,将直接影响数据中心的性能、密度和可靠性。
行业内也由此流行起了PUE的概念,即电源使用效率,用来测算数据中心消耗的所有能源与IT负载消耗的能源的比值,被视为评价数据中心能源效率的重要指标,PUE值越接近1,表明非IT设备的耗能越少,数据中心的能效水平越高。目前国内大型数据中心的平均PUE值为1.55,超大型数据中心平均PUE值也只有1.46。
2020年时国内数据中心的用电量已经超过2000亿千瓦时,占到了用电总量的2.7%,预计2023年数据中心的能耗就将超过2500亿千瓦时,2030年时将超过4000亿千瓦时,用电量占比也将上升到3.7%。就这个角度而言,解决数据中心的能耗问题,已经是摆在案前的棘手挑战。
工信部在《新型数据中心发展三年行动计划(2021-2023年)》中,对数据中心的PUE进行了明确规定:2021年底新建大型及以上数据中心的PUE降低到1.35以下,到2023年时要低于1.3。北京、深圳等城市也对新建数据中心提出了严格要求,其中深圳已经发文鼓励PUE值低于1.25的数据中心。
联想到“碳达峰与碳中和”的时代背景,低PUE的“绿色计算”已经是不争的趋势。淘汰掉高耗能的组件,升级算力高、空间节省、碳排放低的新组件,已经是很多数据中心无法规避的现实问题。
在算力正在重塑产业格局的机遇面前,数据中心已然是无法拒绝的刚需,为数不多的选择在于提高算力效率并降低能耗,而能否找到新的散热方案,逐渐成为计算产业上下游必须应对的课题。
传统的散热方案以风冷为主,即将空气作为冷媒,把服务器主板、CPU等散发出的热量传递给散热器模块,再利用风扇或空调制冷等方式将热量吹走,也是散热系统消耗数据中心近半电力的主要诱因。
当PUE值被严格限定,绿色计算渐渐深入人心的时候,上世纪80年代就开始尝试的“液冷”技术,迅速成了产业上下游的新焦点。其实“液冷”技术的原理并不复杂,简单来说就是利用矿物油、氟化液等绝缘低沸点的冷却液作为冷媒,通过热交换将服务器的热量排出,并演变出了冷板式、喷淋式、浸没式等多种散热方案。
看似只是“冷媒”的改变,却为数据中心的节能降耗带来了诸多可能:
比如风冷热传导存在过程复杂、热阻总和大、换热效率较低等痛点,在很大程度上制约了数据中心的算力密度,并且常常会产生很大的噪声。液冷技术所呈现出的节能降耗、减少噪声、节约空间的特性,不可谓不诱人。
再比如风冷想要提高散热能力,最“简单粗暴”的做法就是提高风扇转速,可把热量带出去的同时,风扇和硬盘间也会形成大的漩涡,不规则的湍流可能会影响硬盘的读写能力,甚至会因为磁头震动导致硬盘报废。
液冷技术近乎完美地规避了这些不利因素,由于液冷方案是一个相对静止的环境,可以有效降低由空气、灰尘和震动引起的硬件产品故障率,且数据中心始终在低温环境中运行,极大地提升了内部电子元器件的使用寿命。
本文标题:数据中心能耗占比分析:液冷散热是数据中心节能减排最佳解决方案
本文链接://www.looklottery.shop/faq3/168.html [版权声明]除非特别标注,否则均为本站原创文章,转载时请以链接形式注明文章出处。