1、事件管理具体来说就是任何可被发现或辨别的事情,此类事情对于IT基础设施的管理或IT服务的交付有重要意义,以及有助于评估可能导致服务出现的偏差影响。
2、事件通常是由IT服务、配置项或者监控工具产生的通知,事件管理中涉及的关键概念包括事件、告警和报警。
3、日常应该监控所有IT基础架构中的事件,检测和升级异常情况,以支持系统和业务的正常运营。
4、事件管理的业务价值包括故障的早期检测,实时和自动异常报告,更高层次甚至可以主动恢复异常。
5、事件工具可以通知到合适的人,记录故障日志,如果集成到能力和可用性管理,工具可以自动检测能力和可用性的问题。
6、告警是当服务或设备的指标接近设定阈值的事件,告警的级别相对较低,及时介入处理有助于减少系统异常发生的机率。
7、报警是当服务或设备的指标达到或超出设定阈值的告警事件;报警通常是由系统监控或管理工具产生的。