请选择 进入手机版 | 继续访问电脑版
发帖
开启辅助访问
 找回密码
 立即注册
取消
搜索
热搜:
活动 交友 discuz
分享到

容易忽略的32条机房运维故障是什么?

#新人报道#时间:2019-05-07 阅读:126 回复:0

561

主题

561

帖子

3165

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
3165
  曾有专家之处,我国国内的计算机机房往往是一流的设计、二流的管理和三流的维护。仅仅对于机房设计投入过多精力,反而在管理和后期维护是频频犯错,导致机房故障、造成极大损失。今天小编为大家列出32条机房常见故障,仅供大家参考预防。
  方案类故障:
  1. 备用开关数量不够,造成后期扩容困难
  2. 地板高度不够,后期下走线线缆多了堵塞风道,造成送风量不够
  3. 中线经过开关触点导致的故障,发电机用手动四极开关转换时切断零线时间过长,零点漂移过高
  4. 配电空开或电缆容量不足引起供电跳闸
  5. 空调下水管过细、过长、弯道太多,极易造成泥沙淤塞
  6. 机房通风地板、吊顶格栅板设置位置不正确,形成机房热点
  安装类故障:
  1. 需要后期维护的机柜却做成了靠墙安装,给后期维护带来困难
  2. 电池桩未紧固,连接松动打火,大电流导致起火又导致电池漏液
  3. 装错互感器导致互感器冒烟
  4. 机房温度计安装位置不正确,不能够获取准确的机房温度
  5. 空调外机安装位置不当,互相对吹、互相干扰,空调经常高压报警
  6. 机柜内设备安装欠合理,造成部分设备冷却出现问题
  操作类故障:
  1. 有的操作员以为电源很简单,不看说明书就按照自己的理解任意操作,结果造成了损失,如所接负载虽未超标称值但已超过了整定值引起跳闸
  2. 关断分路开关前未先行测量一下电流,仍由其供电的设备断电停止工作
  3. 电气操作没有按规定双人临岗,电池极性错接引发事故
  4. 地下插座接线不牢电源加不上
  5. 清扫配电柜顶部时,没注意把初期施工留下的铁屑扫落引起打火跳闸
  6. 服务器送电时因本机柜插座不够,违规借用相邻机柜的,当机房单路供电时引起相邻机柜超载跳电
  处理不及时故障:
  1. 机房漏水已有告警,由于值班员的疏忽而未及时处理,从而造成机房地板下大面积积水,形成巨大隐患
  2. 某单位做UPS放电时,当电池将近放完时电话通知楼下配电间快送电,但一直占线,等到接通时蓄电池已放完,造成停电
  3. 某机房空调模块已坏了一个,但因模块有冗余对机房温度并无影响,过几天气温飙升,另一模块也因压缩机高压报警而损坏,使机房温度失控
  4. 某交换机后部风机出风口因被众多线缆阻挡影响送风,安装开机后发现这一情况,但未及时移除,后来终于发生了交换机内部温度过高而停机,造成多台设备停机。
  维护不当导致的故障:
  1. 对UPS的定期维护是必要的,那些不负责任、不按规定要求进行定期或者不定期保养是导致机器故障的重要原因
  2. 电池部分失效只更换失效的部分,新旧混用对电池性能、寿命影响极大
  3. UPS机器维护完毕没开逆变器,一直在旁路工作,等到市电停电造成机房同时停电才发现
  4. 不按有关规定更换易耗件,如电容、风机、蓄电池的使用寿命等造成故障
  标识类故障:
  1. 标识命名不统一,造成管理上的混乱(如A路用阿拉伯数字,B路用汉字)
  2. 标识信息量不足,无法满足运维要求
  3. 线缆标示没有按要求隔几米要放一个,致使有些地方线缆无法查找
  4. 所用材质较差,时间长了一些标识不清或脱落,又没有及时补全,给以后的工作带来很大困难
  5. 标识内容不全,给工作定位造成困难
  6. 分路开关标示错位导致关错开关
  随着大量数据应用和业务量的激增,对大多数企业来说机房安全运行至关重要。然而,大多数企业低估了维护机房建设安全运行的重要性。据不完全统计,数据中心的机房停机一分钟平均损失将超过8800美元。如果我们的思想不与时俱进,不用科学发展的眼光来分析研究问题,还是按照过去的老观念、老方法,就势必会犯错误。机器功率越来越高、密度越来越大,发生初期的一个小小故障,如果没能及时告警检修,在不长的时间内便可能引发大的变化。

回复
使用道具 举报
快速回复
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

客服电话
173-6185-1240
发布 快速回复 返回顶部 返回列表