bsp; 长期监测并建立基准指标对于保持网络和性能的正常性能水平是非常必要的。通过对网络运行的观察,运维工程师可以知道网络性能的变化和流量等指标的运行趋势;及时发现网络偏离系统基准模型时的异常状况,分析是单一故障,还是严重问题的前兆,达到预警的目的,防止更严重问题的发生。
第四计:设计报警策略,避免警报泛滥
报警是管理网络和业务系统最重要的功能之一,配置报警的依据是根据信息服务管理网的网络运维目标,报警设置的原则:1、对影响网络和业务的重要指标设置报警;2、消除误报和重复报警;3、报警应该以多种方式及时发送给相应的运维工程师。
第五计:创建自动化、规范化事件处理程序
信息服务管理网运维工程师人员少,日常处理事务较多,他们需要在网络、链路和系统运行出现问题时能够有自动化、规范化的页码:[1] [2] [3] [4] [5] 第3页、共5页 |