机房基础设施故障事故上报处置流程范文

更新时间:2021-11-17 下载TXT文档 下载Word文档

机房基础设施故障事故上报处置流程范文

1、一、目标

2、1一级故障的情况下,现场运维人员主动解决故障,运维负责人及时联系专业工程师到场解决故障。值班民警现场关注解决故障进程,并且配合解决外部单位协调工作。

3、2二级故障情况下,项目经理到场主持工作,联系专业工程师以及维修工程师及时到场解决故障。值班民警现场关注解决故障进程,并配合解决外部单位协调工作,同时通知上级主管领导,主管领导到场关注故障维修工作进程。

4、单台的机柜PDU断电、单台UPS及空调关键设备报警、机房温度上升到30℃以上、空调漏水影响到其他区域等。

5、三、定义

6、1一级故障

7、四、故障报告原则

8、2二级故障

9、中心机房,共计3个机房区域。

10、2当发现二级故障的情况下,当班运维人员首先通知运维负责人以及数据中心当日值班民警,值班民警及运维负责人及时赶到现场,同时判断故障产生的原因。值班民警、运维负责人和相应专业技术工程师协调沟通相关部门,相关单位派维修工程师进驻现场解决,短时间(1小时)无法解决的通知项目经理,值班民警及时通知数据中心主管领导。事故恢复后形成事故总结报告

11、故障影响范围小,不会对业务系统造成中断影响,并且不会对其它系统使用造成影响。

12、UPS前端供电中断、空调配电柜前端供电中断、空调冷冻水供水中断(失压)、机房温度超过40℃、网络中断等。

13、1当发现一级故障的情况下,当班运维人员首先进行故障确认,确认故障后进行一般性修复,无法修复的设备及时通报运维管理负责人以及数据中心当日的值班民警,运维负责人通知相应的技术工程师到场维修。事故恢复后形成事故总结报告。

14、1一级故障: (踏雪诗词 taxue.net)

15、关键系统单个设备或独立系统故障,造成单个或局部业务系统中断,不会造成重大业务系统运行中断,不会造成关键系统运行中断。

16、单台UPS电源故障停机、单台空调机组故障停机、环控系统无法检测数据、机房温度超过35℃等。

17、3当发现三级故障情况下,当班运维人员首先通知运维负责人、项目经理以及值班民警并告知物业管理部门相关人员。值班民警、项目经理及运维负责人及时赶到现场,判断故障产生原因上报公司上级领导,值班民警上报主管领导和数据中心主要领导。由相应的数据中心领导、项目经理及物业部领导联系外协单位进行解决。事故恢复后形成事故总结报告。

18、七、故障处置方法

19、加强和规范化中心机房基础设施故障(事故)的报告和处置流程,提高运维保障效率,保证故障(事故)的快速反应并及时修复、恢复,使损失降低到最低。

20、2二级故障:

21、3三级故障:

22、六、故障报告流程

23、先抢修,同报告;先核心,后边缘;先始端,后末端,分故障等级进行处理。

24、二、范围

25、《机房基础设施故障(事故)上报处置流程范文》适用于机房基础设施故障(事故)上报的处置流程,项目经理到场主持工作,并上报公司领导,联系专业工程师及维修工程师及时到场解决故障。值班民警到场关注解决故障进程,并配合解决外部单位协调工作。值班民警及数据中心主要领导和主管领导,以及公司领导到场关注故障维修进程。同时数据中心主管领导通知各个使用单位,启动机房内各业务系统应急预案,同时项目经理安排专业工程师对UPS间、机房内设备等进行应急操作。

26、3三级故障

27、外部出现供水、供电、网络系统等中断,关键性系统造成大面积中断。涉及到外协单位修复,并且无法在短时间(2小时)内恢复,可能造成重大损失。

28、五、故障(事故)类型

29、3三级故障情况下,项目经理到场主持工作,并上报公司领导,联系专业工程师及维修工程师及时到场解决故障。值班民警到场关注解决故障进程,并配合解决外部单位协调工作。值班民警及数据中心主要领导和主管领导,以及公司领导到场关注故障维修进程。同时数据中心主管领导通知各个使用单位,启动机房内各业务系统应急预案,同时项目经理安排专业工程师对UPS间、机房内设备等进行应急操作。机房基础设施故障事故上报处置流程范文是网友投稿分享,属于企业管理范文,共有3834个字。下载本文稍作修改便可使用,即刻完成写稿任务。

以上就是踏雪诗词小编为大家整理的《机房基础设施故障事故上报处置流程范文》相关句子及内容,希望大家喜欢。

内容版权声明:本网站部分内容由网上整理转发,如有侵权请联系管理员进行删除。

文档下载声明:《机房基础设施故障事故上报处置流程范文》文档下载仅供参考学习,下载后请在24小时内删除。

转载注明出处:https://www.texue.net/article/72a6023f252.html

热门内容

回到顶部