2023年度 第3期
标题:
Hadoop集群服务监控预警系统的实现
作者:
朱海伟
作者单位:
中国石油化工股份有限公司石油物探技术研究院,江苏 南京 211103
关键字:
Hadoop集群;监控;自动告警
摘要:
介绍了一种用于Hadoop集群自动化监控、预警系统的实现。通过获取集群节点的内存、CPU、磁盘信息统计节点系统信息,同时统计集群各类Hadoop基础服务的基础信息,如服务的内存使用、存活状态等。系统对收集的信息做异常信息处理与告警,自动推送给系统运维,极大提高了运维的响应速度,缩短问题定位、解决周期。