前言
现在一直在用nagios监控,有时候用起来的时候就是很不爽,特别是在配置的时候 。nagios应该可以更好用才对!
缺啥呢?
1、配置界面。nagios默认有自带的Web界面,但是配置都需要编辑配置文件,无法在Web界面直接配置。
2、监控数据。GUI界面一般都是展示最后一次的检查状态,默认历史数据都没有保留,有时候需要查找问题的时候,就没有数据可以查。
3、监控项确认。监控项都是需要手工确认,然后在修改配置,没有默认的监控项。
4、监控下发。如果要增加一个监控项,就需要在客户端下发脚本并配置对应NRPE命令。我的解决方式
1、一直想开发一套配置界面,可是感觉也是坑,因为机器多了,就不想去配置,界面点多的也是很累的(就是懒)。每台服务器的磁盘、网卡名称、监控服务等都有可能不一样,这样子就需要每台服务器都要收集,才能确认需要监控的名称,这些资产信息还是交给资产系统,只能完善资产系统了,收集更多的信息提供给agios。
2、nagios脚本返回的数据可以加上性能数据,nagios也可以配置性能数据文件,目前采用nagflux+influxDB+Grafana进行性能数据展示。
3、依靠资产收集客户端采集吧!目前,还没实现。
4、NRPE支持远程命令,可以添加一个获取远程命令在本地执行的脚本,放置到被监控的服务器上。可以用eval执行远程传过来的参数,从而实现远程控制。下发脚本的时候,我们可以执行一个wget命令去web服务器下载脚本,然后修改执行位就可以执行了。
例如下面的脚本:
#!/bin/bash
# exec args
eval $*
result=$?
exit $result
总结
nagios二次开发去完善监控,还是需要花比较大的功夫的,特别是资产信息的完善。大家有什么建议吗?目前能想到的只有这些。
留言与评论(共有 0 条评论) |