本人在工作中一般喜欢把MySQL、Redis、Memcached、MongoDB等数据库按照实例的方式对外提供服务。一般都是一台高配的服务器上开启多个实例给每个业务使用。而监控是重中之重,我自己也尝试了多种监控方式,但对我来说感觉最简单最快的就是使用zabbix了,灵活定义key。
由于我是多实例,所以就需要用到zabbix的自动发现功能(LLD)。基本处理方式就是:
2、写状态取值脚本。
3、添加配置文件。
4、添加权限。
5、配置zabbix web。
$ cat /etc/zabbix/zabbix_agentd.d/scripts/memcached_discovery.py
#!/usr/bin/env python
import os
import json
t=os.popen("""sudo netstat -nltp|awk -F: '/memcached/&&/LISTEN/{print $2}'|awk '{print $1}'| grep -v grep | grep -v '^$' """)
ports = []
for port in t.readlines():
r = os.path.basename(port.strip())
ports += [{'{#MCPORT}':r}]
print json.dumps({'data':ports},sort_keys=True,indent=4,separators=(',',':'))
执行脚本看输出结果(最好使用zabbix用户执行,才能看出效果):
$ python /etc/zabbix/zabbix_agentd.d/scripts/memcached_discovery.py
{
"data":[
{
"{#MCPORT}":"11211"
},
{
"{#MCPORT}":"11212"
}
}
我这个脚本中使用了sudo权限,zabbix用户在执行netstat时需要sudo权限。
#!/bin/bash
#
#Auth: Pengdongwen
#Blog: www.ywnds.com
#Email: 593265947@qq.com
#Desc: memcached status monitoring
#dependent:
# 1)yum install nc
# 2)python memcached_discovery.py
#########################
IP=127.0.0.1
if [ $# -lt 2 ];then
echo "please set argument"
exit 1
fi
STATUS=`echo "stats" | nc $IP $PORT | grep -w "$METRIC" | awk '{print $3}'`
case $METRIC in
'version')
echo $STATUS
;;
'uptime')
echo $STATUS
;;
'curr_connections')
echo $STATUS
;;
'total_connections')
echo $STATUS
;;
'cmd_get')
echo $STATUS
;;
'cmd_set')
echo $STATUS
;;
'get_hits')
echo $STATUS
;;
'get_misses')
echo $STATUS
;;
'bytes_read')
echo $STATUS
;;
'bytes_written')
echo $STATUS
;;
'curr_items')
echo $STATUS
;;
'total_items')
echo $STATUS
;;
'expired_unfetched')
echo $STATUS
;;
'evicted_unfetched')
echo $STATUS
;;
*)
echo "Not selected metric"
exit 0
;;
esac
脚本很简单,需要传给脚本两个参数,一个是端口号,另一个是监控值。
有几个特别需要说明的就是:
2)需要指定redis-cli的绝对路径。
3)需要安装dos2unix工具(yum install dos2unix)。
$ cat /etc/zabbix/zabbix_agentd.d/userparameter_memcached.conf
UserParameter=memcached.discovery[*],python /etc/zabbix/zabbix_agentd.d/scripts/memcached_discovery.py
UserParameter=memcached[*],/bin/bash /etc/zabbix/zabbix_agentd.d/scripts/memcached_status.sh $1 $2
这里定义三个key,第一个key是用于自动发现的。第二个key是用于取不同实例的状态值的,传了两个参数,$1是端口号(从自动发现中获取的),第二个是传的参数。端口号和参数我会在zabbix页面配置传给memcached[*]这个key。
都配置完后就可以添加重启一下zabbix-agent了。
$ service zabbix-agent restart
需要给zabbix用户添加sudo权限。
$ cat /etc/sudoers.d/zabbix
Defaults:zabbix !requiretty
zabbix ALL=(ALL) NOPASSWD: SUPERVISORCTLZB
Cmnd_Alias SUPERVISORCTLZB = /sbin/ss,/usr/sbin/ss,/sbin/dmidecode,/usr/sbin/dmidecode,/sbin/service,/usr/sbin/service,/bin/netstat
另外需要注意的是,普通用户zabbix默认环境变量有如下这些:
$ echo $PATH
/usr/local/bin:/bin:/usr/bin:/usr/local/sbin:/usr/sbin
所以你要确认你所有的执行程序都在这些路径下,不然zabbix是获取不到值的。
使用zabbix用户执行看是否正常。
$ sudo -u zabbix `which zabbix_agentd` -t redis.discovery[*]
{
"data":[
{
"{#MCPORT}":"11211"
},
{
"{#MCPORT}":"11212"
}
}
前期工作都做完了,下面就可以配置zabbix web了。
首先创建一个模板(Template Linux Memcached Discovery),然后在模板中创建一个自动发现规则(Linux Memcached Discovery)。
在这个自动发现规则内创建一个item。
然后可以创建trigger等。
下面我提供一个模板Github:https://github.com/dongwenpeng/zabbix