点击上方"walkingcloud"关注,并选择"星标"公众号
10分钟搞定Zabbix监控平台告警推送到钉钉群
Zabbix的安装与部署可以参考之前的文章
以及钉钉机器人的创建不再详细描述
1、下载并安装PrometheusAlert
https://github.com/feiyu563/PrometheusAlert
mkdir /opt/PrometheusAlert
unzip PrometheusAlertLinux.zip -d /opt/PrometheusAlert/
cd /opt/PrometheusAlert/
cp zabbix /usr/lib/zabbix/alertscripts/zabbixclient
chmod 755 /usr/lib/zabbix/alertscripts/zabbixclient
chown zabbix:zabbix /usr/lib/zabbix/alertscripts/zabbixclient
/usr/lib/zabbix/alertscripts/zabbixclient -h

(图片可点击放大查看)
设置PrometheusAlert开机自启动
vi /etc/rc.local
加入如下一行
nohup /opt/PrometheusAlert/PrometheusAlert &
chmod +x /etc/rc.d/rc.local
然后手动启动PrometheusAlert
nohup /opt/PrometheusAlert/PrometheusAlert &
firewall-cmd --permanent --zone=public --add-port=8080/tcp
firewall-cmd --reload

(图片可点击放大查看)
2、修改触发器显示选项
用表情符号显示,是为了让告警更直观

(图片可点击放大查看)
3、Zabbix上创建告警媒介类型
类型为脚本
相关参数参考PrometheusAlert官方文档进行填写

(图片可点击放大查看)

(图片可点击放大查看)
创建后可以先测试一下机器人

4、添加用户
例如yuanfan

(图片可点击放大查看)
告警媒介选上一步创建的PrometheusAlert类型

(图片可点击放大查看)
5、配置触发器动作中消息模板
-
先配置触发器动作

(图片可点击放大查看)

(图片可点击放大查看)
操作——操作细节——消息模板如下
## [Zabbix平台告警信息](https://zabbix.walkingcloud.cn)
--------------------------------------------------------
##### {TRIGGER.NAME}
--------------------------------------------------------
##### 【故障发生时间】:{EVENT.DATE} {EVENT.TIME}
##### 【告警级别】:{TRIGGER.SEVERITY}
##### 【故障前状态】:{ITEM.LASTVALUE}
##### 【故障事件ID】:{EVENT.ID}
##### 【故障主机IP】:{HOST.IP}
##### 【故障主机名】:{HOST.NAME}
##### 【故障时长】:{EVENT.AGE}
##### 【故障是否确认】:{EVENT.ACK.STATUS}
--------------------------------------------------------
##### 事件状态:{EVENT.STATUS}

(图片可点击放大查看)
恢复操作——操作细节——消息模板如下
## [Zabbix监控平台告警信息](https://zabbix.walkingcloud.cn)
--------------------------------------------------------
##### {TRIGGER.NAME} 已经恢复 ✅
--------------------------------------------------------
##### 【故障恢复时间】:{EVENT.RECOVERY.DATE} {EVENT.RECOVERY.TIME}
##### 【告警级别】:{TRIGGER.SEVERITY}
##### 【故障前状态】:{ITEM.LASTVALUE}
##### 【故障主机IP】:{HOST.IP}
##### 【故障主机名】:{HOST.NAME}
##### 【故障时长】:{EVENT.AGE}
##### 【故障是否确认】:{EVENT.ACK.STATUS}
--------------------------------------------------------
##### 事件状态:{EVENT.STATUS}

(图片可点击放大查看)
更新操作——操作细节——消息模板如下
## [Zabbix监控平台告警信息](https://zabbix.walkingcloud.cn)
--------------------------------------------------------
##### {USER.FULLNAME} 已经确认故障原因
--------------------------------------------------------
##### 【故障确认时间】:{ACK.DATE} {ACK.TIME}
##### 【告警级别】:{TRIGGER.SEVERITY}
##### 【故障前状态】:{ITEM.LASTVALUE}
##### 【故障主机IP】:{HOST.IP}
##### 【故障主机名】:{HOST.NAME}
##### 【故障时长】:{EVENT.AGE}
##### 【故障原因】:{ACK.MESSAGE}
##### 【故障是否确认】:{EVENT.ACK.STATUS}✅
--------------------------------------------------------
##### 事件状态:{EVENT.STATUS}

(图片可点击放大查看)
6、触发告警及效果展示
例如192.168.31.127上/boot分区写满测试
dd if=/dev/zero of=/boot/test.iso count=1 bs=1024M
df -PTh

(图片可点击放大查看)

(图片可点击放大查看)

(图片可点击放大查看)
web界面上确认故障时的效果

(图片可点击放大查看)

(图片可点击放大查看)

(图片可点击放大查看)
告警恢复时钉钉告警效果

(图片可点击放大查看)