数据中心的预防性维修不应该成为您时而心血来潮的事情,尤其是考虑到其潜在的停机时间成本。
一、安全第一
每次进行电源维护时,切记生命和身体安全应胜过一切。当处理电源设备时,可能哪怕一个小小的操作失误也会造成严重伤害或死亡。因此,当处理UPS(或数据中心的任何电力系统)时,确保安全是首要考虑的问题:包括遵守设备制造商的建议,注重设施特殊的细节和标准的安全指引。如果您对于UPS系统的某些方面不熟悉,或不知道如何对其进行维护,请找专业人士寻求帮助。即使您了解您数据中心的UPS系统,仍然有必要寻求相应的外界援助,以便在涉及到某些潜在问题时能有头脑冷静的人给予您帮助,使您不会受压力困扰。
二、坚持定期维护
数据中心的预防性维修不应该成为您时而心血来潮的事情,尤其是考虑到其潜在的停机时间成本。对于您数据中心的UPS系统以及其他系统而言,应定期进行维护(以年、半年或任何时间框架为单位),并坚持贯彻这一维护计划。这包括一份书面的(纸质或电子版)备案清单,记录好下一次维护活动和上一次维护的具体时间。
三、做好详细记录
除了安排好定期的维护计划,您的数据中心也应该有一份详细的维修记录(例如,清洗、修理或更换某些部件的记录),以及在在检查过程中,发现的相关设备的具体状况。而当您需要向数据中心的领导汇报维护成本或每次停机时间所造成的成本损失时,进行成本跟踪也是非常有益的。一份详细的任务清单,如检查电池腐蚀情况,寻找过量扭矩的连接导线等,有助于维持一个有秩序的方法。而当在进行设备更换、不定期的维修、和UPS故障排除规划时,所有这些文档都可以提供帮助。除了做好记录之外,请务必确保这些文档始终放在一个方便得到且大家都知道的位置。
四、执行定期检查
上述三点建议适用于数据中心的几乎任何一部分:无论怎样的数据中心环境,加强安全、调度维护和保持良好的记录都是很好的做法。然而,对于UPS系统,需要有工作人员定期进行某些任务(这些工作人员应该熟悉UPS操作的基本知识)。这些重要的UPS维护工作包括以下几个方面:
围绕UPS和电池(或其他能量存储)设备进行的障碍物和相关冷却设备方面的检查。
确保没有发生运行异常或UPS控制面板没有发出任何类似于过载或电池电量即将耗尽的警报。
注意查看电池腐蚀或其它缺陷的迹象。针对那些特定设备,咨询制造商的指导方针和建议。在某些情况下,您应该严格履行设备制造商的维护建议(或聘请专业人士来做)。
五、认识到UPS组件发生运行失败是可能的
这似乎是显而易见的:任何具有有限故障概率的设备,最终都会发生运行失败的状况。报告指出:“关键的UPS部件,如电池和电容器不可能始终保持正常使用状态。”所以,即使您的供电方提供了完美的动力,您的UPS机房是完全干净的,并且UPS设备是在适当的温度理想情况下运行的,相关组件仍然会发生运行失败的状况。正因为如此,您才需要对UPS系统进行维护。
六、确保您知道当需要相关服务或不定期的维护时,向谁求助
有时,在日常检查的过程中,您会发现某些问题,而这些问题不能等到下次维护的时候才解决。在发生这些情况的时候,您要确保知道联系谁能够帮你搞定,这样可以节省大量的时间和精力。这意味着您的数据中心必须确定一家或几家固体的服务提供商,在您需要时提供帮助。这些供应商与为您提供定期维护的供应商可以是同一家,也可以不是同一家。(如果某一家供应商那里有您数据中心完备的维修记录,他们将能够为您提供最有用的信息,所以要求该供应商到来。能够帮助您潜在的节省大量时间和金钱)
七、进行任务分配
“您不是应该上周进行检查?”“不,我觉得应该是您检查的。”为了避免这种责任不明晰的混乱,请务必确保安排合适的专门人员负责UPS维护任务。哪位工作人员需要负责每周检查设备?哪位工作人员负责联系服务供应商,安排年度维护计划(或者调整维护时间表)?特定的任务可能有不同的负责人,但是要确保知道谁负责您的UPS系统。
以上就是良许教程网为各位朋友分享的Linu系统相关内容。想要了解更多Linux相关知识记得关注公众号“良许Linux”,或扫描下方二维码进行关注,更多干货等着你 !