前言
Ganglia主要用来监控系统性能的软件,通过曲线很容易见到每个节点的工作状态,对合理调整,分配系统资源,提高系统整体性能起到重要作用,支持浏览器方式访问,但不能监控节点硬件技术指标。Ganglia是分布式的监控系统。
Redis现在在业务中应用已经很广泛了,但是如何监控redis,实时的观察redis的性能,在搜索引擎搜索“ganglia监控redis”,发现都是13年的老文章,都是说要到https://github.com/ganglia/gmond_python_modules这个第三方插件库下载redis监控模块
解决方法
但是我发现gmond_python_modules
这个repo下面已经没有redis模块了,于是查看git log
,发现redis模块已经集成到ganglia源码包里了
于是下载了源码包,搜索之后发现redis模块位于gmond/python_modules/db/redis.py
,配置文件在gmond/python_modules/conf.d/redis.pyconf.disabled
。
修改配置文件里的host和port两个参数为要监控redis的ip和端口,然后将两个文件复制到对应的目录下。(通常redis.pyconf
复制到ganglia安装目录/etc/conf.d/
下,redis.py复制到ganglia安装目录/lib64/ganglia/python_modules
)
重启gmond,可以看到有redis的图出来了,但是数据却都是空的。
于是停掉gmond,使用gmond -f -d 1
启用调试模式,发现redis.py报错
[PYTHON] Can't call the metric handler function for [connected_clients] in the python module [redis]. Traceback (most recent call last): File “/opt/gmond/lib64/ganglia/python_modules/redis.py”, line 21, in metric_handler n, v = line.split(“:”) ValueError: need more than 1 value to unpack
查看上下文代码
for line in info.splitlines()[1:]: if "" == line: continue n, v = line.split(":")
大概意思是把redis info
命令输出的每一个非空行用:分割,但是我安装的redis版本是2.8+,info命令会输出类似#Server这样的注释,这样就导致按:分割失败,所以python报错,gmond取不到值。
所以解决方案也很简单,把上面那段代码修改成如下即可,也就是跳过空行和以#开头的行
for line in info.splitlines()[1:]: if "" == line or line[0] == '#': continue n, v = line.split(":")
再重启gmond,过一会就可以在ganglia看到数据了
==========================================
看了下ganglia在github上的代码,发现最新代码已经把这个bug修复了,只不过还没有release
以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作能带来一定的帮助,如果有疑问大家可以留言交流。