建设高可用不间断电源供电系统的原因及解决方案

2021-03-15 14:55 来源:电子说

近年来,随着数据中心的大规模建设,传统供电系统在大规模部署和运行中暴露出的可靠性和可维护性问题日益突出,促使用户、设备制造商和方案设计公司共同努力,对供电系统进行创新和优化。供电系统的建设理念逐渐从传统的注重可靠性转向保证可用性。然后,本文讨论了为什么以及如何构建高可用性电源系统。

可用性综合反映了用户的真实需求,可靠性是影响可用性的因素之一

可靠性是用可靠性来衡量的,可靠性定义为“给定系统在规定的工作条件下,在预计时间内连续完成规定功能的概率”。MTBF(也称平均故障间隔时间)是决定供电系统可靠性的重要指标,MTBF可以通过定量和定时的工业试验或理论计算得到。可用性是指当产品需要在任何随机时刻启动和执行时,产品处于可工作或可用状态的程度。可用性计算公式为:

高可用UPS供电系统建设的理由和解决方案

在这个公式中,平均故障间隔时间(MTBF)是平均故障间隔时间,MTTR(平均故障间隔时间)是平均维修时间。

可靠性代表供电系统是否容易出现故障。但是从实际应用的角度来看,任何设备都不可能保证在其生命周期内不会完全失效。用户希望设备尽量不要出现故障,即使出现故障也不会影响业务;如果业务受到影响,应尽快排除故障。相比之下,可用性的定义比可靠性的定义更广泛。对于可修复系统,它不仅涵盖了设备是否容易出错,还涵盖了设备是否容易从故障中恢复。显然,可用性更真实地反映了用户的需求。

在不间断电源行业,通常使用几个“9”来表示系统的可用性。指系统上线一年内可以生产的时间比例。例如,有6个“9”(可用性可以达到99.9999%),这意味着每年可能的停机时间不到32秒。不间断电源系统的目标是提高不间断电源供电系统的可用性,减少市电的影响。

提高电源可用性的方法

提高供电系统的可靠性

从可用性计算公式可以看出,提高可靠性是提高可用性的重要途径。提高供电设备的可靠性有四个层次:

一、设计标准水平。在产品规划设计阶段,要充分考虑产品可能的应用环境,选择相应的设计标准。应充分评估电气隔离、电磁干扰/电磁兼容、防雷、防浪涌、防噪声干扰等电气环境,防潮、防尘、防震、防腐蚀等自然环境,以及运行、维护、管理、运输和安装等人类环境,以构建合理的产品设计框架。

第二,设备层面。在产品设计阶段,对器件进行严格筛选,以匹配最佳电路设计,并通过模拟各种恶劣环境,反复测试器件的应力裕度,以保证各种元器件的可靠运行。对于电解电容等关键器件,如果电路设计不够优化,纹波电流过高,铁芯温度过高,使用寿命会大大缩短,导致设备可靠性下降。冷却风扇还应由稳定性好、性能优异的制造商提供,以防止风扇故障导致电源模块温度升高,影响正常供电。

第三,组件级。组件的可靠性主要体现在它的稳定性和冗余性上。在组件故障率最小化的前提下,对关键组件采用冗余设计是提高组件级可用性的最有效途径。

第四,程序层面。通过优化系统设计,供电系统运行可靠稳定,具有容错能力,整个供电路径无单点故障。图1显示了没有单点故障的冗余系统架构。该方案由两套系统组成。在每个系统中,A4链路为冗余输入,A5链路为备用电路,A6采用模块化不间断电源或并联机器,A7为单电源负载提供双向保证。如果条件允许,A1、A2链路采用双向市电输入,单电源系统可靠冗余。然后,方案采用2N容错设计,基本实现无单点故障和在线维护。

图1无单点故障的冗余系统架构

提高不间断电源供电设备的可维护性

减少维护时间是提高可用性的另一个重要方法。模块化设计可以有效提高可维护性,减少维护时间。UPS设备各功能单元模块化后,故障后只需更换相应的备件,大大降低了维护的技术门槛,运维人员可以自行更换维护。不仅可以有效降低维护成本,而且可以大大缩短维修时间,从而最大限度地减少业务损失。此外,模块化易于实现在线维护,即故障修复时可以关闭负载。如果需要切断电源进行维护,就要拉备用电源给负载供电,所以维护非常复杂,需要很长时间。

提高不间断电源供电设备的可用性

易用性是供电设备“可用性”的升华,直接影响用户的产品体验。从用户角度来说,需要从以下几个方面进行改进:便于携带和安装。这就要求产品足够小,足够轻,模块化,可分解,从而降低运输和安装的难度。此外,不间断电源是否支持上下进线和平行柜安装也会影响安装

难度。②易扩容。数据中心一般都有未来的扩容计划,以匹配未来的业务增长需要。而现网的UPS供电设备为了确保可靠性通常供电路径非常复杂,牵一发而动全身,扩容非常不便,即使条件满足也有负载断电的重大风险。这样的供电现状显然是不易用的。如果能够像通信电源一样,功率模块可以热插拔,扩容只需采购功率模块在线插进去,那么扩容的易用性就可大幅改善。③易管理。UPS设备要高度智能化,各个供电节点做到可视化管理,便携化管理。比如,可以开发手机APP进行随身监控和管理。

UPS供电系统可用性发展的历程

第一代UPS——动态UPS。其利用机械惯性储能以及电动机、发电机的能量传输机制以提供短时间的不间断供电,体积庞大、造价昂贵、噪声巨大,犹如一个小型电厂。动态UPS的特征是占地面积较大,噪音大,不易维护和使用,接近一套工程设备。

第二代UPS——工频机。相比于动态UPS,其可用性提升主要体现在以下几个方面:第一,体积变小,搬运和安装难度降低;第二,备电时间可以由后备电池决定,从动态UPS的秒级备电上升到小时级;第三,可以对较差电网优化,如果一旦电网波动比较大,可以给后端设备提供相对稳定的电力供应。但是,工频UPS依然存在一些问题:第一,运输与安装问题。工频机因为体积庞大无法通过门和内置的升压用变压器重量太重无法使用电梯运输等,导致安装此类UPS经常要打墙安装、吊车运输;第二,维护问题,UPS主机类似黑盒设计,有任何故障或者异常都只能依托原厂家维修,运维人员不敢直接打开操作,时间响应慢,对业务影响大。

第三代UPS——高频机。高频机的出现进一步提升了功率密度,体积减小了50%,从功能模块上提升了维护性,缩短了MTTR时间,可在数小时内完成修复。重量较工频机进一步降低,有效提升了工程的可安装性。同时,高频机也大都采用了全数字化的高集成化设计,在维护性方面也有较大改进。THDi可以做到5%以下,明显减少电网的谐波污染,效率也进一步提升到92-96%,体现出其节能优势。但是,对设备可用性的追求探索并未停止:单点故障是否可以排除?故障修复时间是否可以缩短至分钟级?维护技术门槛可否降低至可以自行维护?

第四代UPS——模块化高频UPS。高频机技术的发展为UPS的模块化架构提供了技术可能,结合类似通信电源的模块冗余技术的供电架构,模块化的高频UPS得以实现。①可靠性大幅提高,常态工作的功率模块、控制模块实现全模块化冗余,消除单点故障点。②经济效益显著,模块化技术使得UPS效率上了一个新台阶,同时采用了通信电源成熟的智能休眠功能,让UPS系统始终处于最佳效率点。③可维护性方面揭开了历史崭新的一页,维护技术门槛也大幅下降。对于单模块容量50KVA以下的小系统模块化UPS,采用模块热插拔技术运维人员可以自行在线维护和扩容,故障修复时间和扩容时间也缩短至分钟级,,对于单模块容量200KVA以上的模块化UPS,采用模块隔离技术,虽然重量较重无法热插拔,但运维人员可以自行在线分、合模块来维护和查找故障,大幅度缩短修复时间,同时剩余模块自行保证用户的容量可用性。④在安装、运输上也体现出了模块化的明显优势——各单元模块化可拆卸。模块化高频机UPS的功率密度比上一代产品更高,占地面积更小。

结语

UPS供电设备的核心价值是保障高可用性,为用户提供高品质、易用的不间断供电从而确保业务的稳定运行,因此,对于数据中心UPS供电设备而言,我们需要转换设计理念,从可靠性的点向可用性的面演进。而模块化UPS相比传统UPS在可靠性、易维护性、易用性等各个方面均有优异的表现,可更有力地保障业务的连续性与稳定运行,更契合用户对于高可用供电的需求。

责任编辑:gt

延伸 · 阅读