10分钟帮你搞定Zabbix监控平台告警推送到钉钉群

点击上方"walkingcloud"关注,并选择"星标"公众号

10分钟搞定Zabbix监控平台告警推送到钉钉群 

Zabbix的安装与部署可以参考之前的文章 

以及钉钉机器人的创建不再详细描述

1、下载并安装PrometheusAlert

https://github.com/feiyu563/PrometheusAlert

mkdir /opt/PrometheusAlert
unzip PrometheusAlertLinux.zip -d /opt/PrometheusAlert/
cd /opt/PrometheusAlert/
cp zabbix /usr/lib/zabbix/alertscripts/zabbixclient
chmod 755 /usr/lib/zabbix/alertscripts/zabbixclient 
chown zabbix:zabbix /usr/lib/zabbix/alertscripts/zabbixclient
/usr/lib/zabbix/alertscripts/zabbixclient -h

(图片可点击放大查看)

设置PrometheusAlert开机自启动

vi /etc/rc.local
加入如下一行
nohup /opt/PrometheusAlert/PrometheusAlert &
chmod +x /etc/rc.d/rc.local


然后手动启动PrometheusAlert
nohup /opt/PrometheusAlert/PrometheusAlert &
firewall-cmd --permanent --zone=public --add-port=8080/tcp
firewall-cmd --reload

(图片可点击放大查看)

2、修改触发器显示选项

用表情符号显示,是为了让告警更直观 

(图片可点击放大查看)

3、Zabbix上创建告警媒介类型

类型为脚本 

相关参数参考PrometheusAlert官方文档进行填写 

(图片可点击放大查看)

(图片可点击放大查看)

创建后可以先测试一下机器人

4、添加用户

例如yuanfan 

(图片可点击放大查看)

告警媒介选上一步创建的PrometheusAlert类型 

(图片可点击放大查看)

5、配置触发器动作中消息模板

  • 先配置触发器动作

    (图片可点击放大查看)

    (图片可点击放大查看)

  • 操作——操作细节——消息模板如下
## [Zabbix平台告警信息](https://zabbix.walkingcloud.cn)
--------------------------------------------------------
##### {TRIGGER.NAME} 
--------------------------------------------------------
##### 【故障发生时间】:{EVENT.DATE} {EVENT.TIME}
##### 【告警级别】:{TRIGGER.SEVERITY}
##### 【故障前状态】:{ITEM.LASTVALUE}
##### 【故障事件ID】:{EVENT.ID}
##### 【故障主机IP】:{HOST.IP}
##### 【故障主机名】:{HOST.NAME}
##### 【故障时长】:{EVENT.AGE}
##### 【故障是否确认】:{EVENT.ACK.STATUS}
--------------------------------------------------------
#####  事件状态:{EVENT.STATUS}

(图片可点击放大查看)

  • 恢复操作——操作细节——消息模板如下
## [Zabbix监控平台告警信息](https://zabbix.walkingcloud.cn)
--------------------------------------------------------
##### {TRIGGER.NAME} 已经恢复 ✅
--------------------------------------------------------
##### 【故障恢复时间】:{EVENT.RECOVERY.DATE} {EVENT.RECOVERY.TIME}
##### 【告警级别】:{TRIGGER.SEVERITY}
##### 【故障前状态】:{ITEM.LASTVALUE}
##### 【故障主机IP】:{HOST.IP}
##### 【故障主机名】:{HOST.NAME}
##### 【故障时长】:{EVENT.AGE}
##### 【故障是否确认】:{EVENT.ACK.STATUS}
--------------------------------------------------------
#####  事件状态:{EVENT.STATUS}

(图片可点击放大查看)

  • 更新操作——操作细节——消息模板如下
## [Zabbix监控平台告警信息](https://zabbix.walkingcloud.cn)
--------------------------------------------------------
#####  {USER.FULLNAME} 已经确认故障原因 
--------------------------------------------------------
##### 【故障确认时间】:{ACK.DATE} {ACK.TIME}
##### 【告警级别】:{TRIGGER.SEVERITY} 
##### 【故障前状态】:{ITEM.LASTVALUE}
##### 【故障主机IP】:{HOST.IP}
##### 【故障主机名】:{HOST.NAME}
##### 【故障时长】:{EVENT.AGE}
##### 【故障原因】:{ACK.MESSAGE}
##### 【故障是否确认】:{EVENT.ACK.STATUS}✅
--------------------------------------------------------
#####  事件状态:{EVENT.STATUS}

(图片可点击放大查看)

6、触发告警及效果展示

例如192.168.31.127上/boot分区写满测试

dd if=/dev/zero of=/boot/test.iso count=1 bs=1024M
df -PTh

(图片可点击放大查看)

(图片可点击放大查看)

(图片可点击放大查看)

web界面上确认故障时的效果 

(图片可点击放大查看)

(图片可点击放大查看)

(图片可点击放大查看)

告警恢复时钉钉告警效果 

(图片可点击放大查看)

请使用浏览器的分享功能分享到微信等