请选择 进入手机版 | 继续访问电脑版
发帖
开启辅助访问
 找回密码
 立即注册
取消
搜索
热搜:
活动 交友 discuz
分享到

如何选择恰当的监控运维?

#新人报道#时间:2019-06-28 阅读:107 回复:0

561

主题

561

帖子

3165

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
3165
  符合业务自身运维特点的各专业业务服务视图的定制是一个较为漫长的艰苦工作,需要反复推敲完善。即便这个视图做得相对比较完善了,多维信息有效地整合在一个直观的维度上了,我们还有一项重要的工作要做,那就是如何保证关键应用的7×24小时运维保障的有效实现。
  任何时间我们都无法保证能全天候死盯着屏幕,所以一方面需要制定相应的运维管理制度和轮班值守职责,另一方面则需要选择更加人性化的运维管理方式。我们在实际部署过程中发现,大家不但需要声、光、邮件的告警触发通知,也迫切需要在移动办公状态或休假状态第一时间得到预警,从而做出应有的反应,这样大家不约而同地想到了手机短信这一公认的快捷通信方式,无论在非工作时间还是休假期间,运维人员均会在故障发生的第一时间收到告警信息,从而通过现场或VPN手段及时响应处理故障。在为运维做需求分析的过程中也需要关注几点。
  1. 告警事件的有效归并和根源事件的有效判断、触发是最为关键的一点,如果这个工作做不到位,这种告警信息势必形成疯狂的轰炸效应,那么运维人员就被这种大量的事件风暴骚扰得要摔手机了。
  2. 运维手段的丰富替代不了人工的直接介入,虽然运维的自动化是较为理想的状态。但实际运维环境中这种自动化还没有人敢轻易尝试,所以针对关键应用,必要的轮班制度还是要建立并逐步完善。
  3. 对于关键应用必须制定紧急故障处理预案,在故障真的发生时,除了能第一时间告知相关运维团队技术人员到位以外,故障的处理步骤、各部门的协调联动都对及时恢复业务应用起着至关重要的作用。
  在建立多维信息整合的各业务服务视图过程时,不宜一开始就确立庞大的目标。因为这种整合实施不仅是选购一套网管软件就能完成的事,更是一种管理变革过程。要注意循序渐进,开始时可以粒度比较粗,后续逐步螺旋迭代完善,并随时根据企业业务的变化进行相应调整。前期各采集模块的有效部署、告警事件的有效归并、分析等都是不可或缺的一环。在一个周密计划的信息化建设大架构下,做到分期、分步骤、有阶段性明确目标的建设实施,则会使我们少走弯路,有效地保证投资的高回报率。

回复
使用道具 举报
快速回复
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

客服电话
173-6185-1240
发布 快速回复 返回顶部 返回列表