高防服务器数据中心再爆重大宕机事故 科学的评估很重要
小刀网络 2023-08-15 08:10:20 0

近日,某IDC公司机房宕机直接致使某商业银行业务中断,此事引发了银监会的高度重视,并发布了《中国银监会办公厅关于银行业金融机构数据中心基础设施外包风险提示的通知》。通知指出,银行业金融机构要展开自查,从加强外包风险管理,加强对基础设檀越动管理,提高业务连续性管理水同等三方面采取防范和应对措施。

据了解,此次宕机事故的缘由是:机房内电力负载太高,造成配电柜开关跳闸,供电中断,空调停止运行,生产机房温度升高致使的装备宕机。

其实,类似的事件不是第一次产生了,之前中国信息通讯研究院的专家就针对数据中心机房故障的缘由做出过总结,专家们表示,数据中心机房故障多发的缘由关键或者在运维管理上,所谓“三分技术,七分管理”,数据中心的故障大多来自人祸。

结合事件缘由及之前案例,我们不难分析,致使此次事故的很大一部份缘由也是“运维管理不到位”。

首先在建设数据中心之前没有对负载做出充分的预估,致使电闸配置不能满足负载的需要;其次,在产生事故以后,应急处置能力不足,致使不能及时的解决突发事件;另外,机房制冷方面仅依赖空调制冷,没有设置高温应急措施,致使机房延续高温。

频繁的数据中心故障和宕机事故表明,某些数据中心在一味满足客户个性化需求的同时,疏忽了本身运维管理能力的提升,致使数据中心可靠性下降,从而产生此类事件。而客户在选择数据中心的时候则存在着,不知道该怎么选择优秀的公司,如何去评估一个数据中心的管理能力,如何规避风险,和如何审查公司对合同的履行力度。

在客户本身没法评估数据中心服务能力的时候,来自政府或权威第三方的权威评估就显得尤其重要。

自2014年以来,工信部一直关注着数据中心的服务能力。其下属组织数据中心同盟,也一直致力于推动数据中心产业的健康发展。为了更好的规范数据中心服务体系,提高数据中心的服务能力水平,保证数据中心客户在选择数据中心公司及相应服务有充分的参考根据。同时,为了将主管单位政策落到实处,在工信部的指点下组织相关领导,技术专家和行业用户,完成了数据中心服务能力评价标准的编撰工作。

数据中心服务能力评价标准是从用户视角动身的评估体系,是目前国内最科学的一套评估体系,它能够全面体现一个数据中心的整体服务能力。

通过对数据中心进行评估,不但可以很好的帮助客户解决痛点。同时,也能够帮助数据中心公司了解本身现状,增强本身的市场竞争力,留住现有客户并发展新的客户,规避运维进程中的各类风险,为客户提供更加优良的服务。

总而言之,通过科学规范的评估,可以帮助客户认清公司,也能够使公司看清自己,从而减少宕机事件的产生,增进数据中心行业健康有序的发展。

标签: 数据中心能力
相关信息推荐