Loading... 在本博客中,”zabbix”是一个系列文章,如果你还不明白zabbix的相关概念,强烈建议从zabbix系列文章中的第一篇开始阅读,否则你可能无法理解这篇文章中涉及到的部分名词。 zabbix系列文章列表直达链接:<a href="https://www.zsythink.net/archives/tag/zabbix/" target="_blank" rel="noopener">zabbix入门系列</a> <img class=" lazyloaded" title="1482653318300146.png" src="https://www.zsythink.net/wp-content/uploads/ueditor/php/upload/image/20161225/1482653318300146.png" alt="blob.png" data-src="https://www.zsythink.net/wp-content/uploads/ueditor/php/upload/image/20161225/1482653318300146.png" style=""> 在之前的文章中,我们已经总结了主机、监控项、触发器、事件、动作等相关知识点,但是到目前为止,还没有真正的收到过任何一个zabbix中的警告,那么这次,我们就在之前的基础上,刻意的让某个监控项达到指定的阈值,看看能否正常的收到报警信息。 在开始实验之前,先描述一下我们的测试环境。 被监控主机的IP地址为192.168.1.107 ,被监控主机的名称为”testzbx1.zsythink.net”,简易名称为”testzbx1″。 <img class=" lazyloaded" src="https://www.zsythink.net/wp-content/uploads/2017/01/010417_0238_1.png" alt="" data-src="https://www.zsythink.net/wp-content/uploads/2017/01/010417_0238_1.png" style=""> 在被监控主机上,我们定义了两个监控项,分别用于监控cpu的上下文切换次数和磁盘根分区的使用率。 <img class=" ls-is-cached lazyloaded" src="https://www.zsythink.net/wp-content/uploads/2017/01/010417_0238_2.png" alt="" data-src="https://www.zsythink.net/wp-content/uploads/2017/01/010417_0238_2.png" style=""> 我们已经为”RootPartitionUsed”监控项创建了一个触发器,触发器如下。 <img class=" lazyloaded" src="https://www.zsythink.net/wp-content/uploads/2017/01/010417_0238_3.png" alt="" data-src="https://www.zsythink.net/wp-content/uploads/2017/01/010417_0238_3.png" style=""> 并且已经定义了对应的动作,当上述触发器被触发时,如下动作会被执行。 <img class=" ls-is-cached lazyloaded" src="https://www.zsythink.net/wp-content/uploads/2017/01/010417_0238_4.png" alt="" data-src="https://www.zsythink.net/wp-content/uploads/2017/01/010417_0238_4.png" style=""> 好了,现在我们故意造成磁盘使用率超过指定阈值的情况,看看会不会受到警报,在操作之前,先看看我们的磁盘使用率的监控情况。 <img class=" lazyloaded" src="https://www.zsythink.net/wp-content/uploads/2017/01/010417_0238_5.png" alt="" data-src="https://www.zsythink.net/wp-content/uploads/2017/01/010417_0238_5.png" style=""> 磁盘使用率为11.14%,阈值为13% <img class=" lazyloaded" src="https://www.zsythink.net/wp-content/uploads/2017/01/010417_0238_6.png" alt="" data-src="https://www.zsythink.net/wp-content/uploads/2017/01/010417_0238_6.png" style=""> 好了,现在我们进入到被监控主机的根分区,在根分区中创建一个大文件,提高磁盘使用率。 <img class=" lazyloaded" src="https://www.zsythink.net/wp-content/uploads/2017/01/010417_0238_7.png" alt="" data-src="https://www.zsythink.net/wp-content/uploads/2017/01/010417_0238_7.png" style=""> 在创建文件的过程中,观察对应的监控图形,发现图形中出现上升曲线,并且已经超过对应的阈值。 <img class=" lazyloaded" src="https://www.zsythink.net/wp-content/uploads/2017/01/010417_0238_8.png" alt="" data-src="https://www.zsythink.net/wp-content/uploads/2017/01/010417_0238_8.png" style=""> 磁盘使用率超出阈值以后,触发器被触发,触发器的状态从”OK”转为”Problem”,点击”监测中”—-“事件”,即可看到触发器对应的状态变化。 <img class=" lazyloaded" src="https://www.zsythink.net/wp-content/uploads/2017/01/010417_0238_9.png" alt="" data-src="https://www.zsythink.net/wp-content/uploads/2017/01/010417_0238_9.png" style=""> 触发器状态已经从”正常”变为”问题”,最新的事件出现在事件列表的最上方 <img class=" ls-is-cached lazyloaded" src="https://www.zsythink.net/wp-content/uploads/2017/01/010417_0238_10.png" alt="" data-src="https://www.zsythink.net/wp-content/uploads/2017/01/010417_0238_10.png" style=""> 此时,我们收到了报警邮件,还记得我们在”动作”中使用过的”宏”吗,PROBLEM为触发器的状态,RootPartitionUsedTrigger为触发器的名称,它们组成了邮件的标题。 如果你不能正常的收到报警邮件,请检查你的”报警媒介”是否能够正常工作,如果使用了脚本类型的”报警媒介”,请确定脚本有正确的执行权限,如果使用了脚本调用了对应的邮件。 <img class=" ls-is-cached lazyloaded" src="https://www.zsythink.net/wp-content/uploads/2017/01/010417_0238_11.png" alt="" data-src="https://www.zsythink.net/wp-content/uploads/2017/01/010417_0238_11.png" style=""> 打开邮件中的附件,内容如下,已经监控到磁盘使用率超过了我们设置的阈值,阈值为13% <img class=" lazyloaded" src="https://www.zsythink.net/wp-content/uploads/2017/01/010417_0238_12.png" alt="" data-src="https://www.zsythink.net/wp-content/uploads/2017/01/010417_0238_12.png" style=""> 好了,现在我们删除对应的测试文件,让根分区的值还原到正常范围内。 <img class=" lazyloaded" src="https://www.zsythink.net/wp-content/uploads/2017/01/010417_0238_13.png" alt="" data-src="https://www.zsythink.net/wp-content/uploads/2017/01/010417_0238_13.png" style=""> 观察对应的监控图形,磁盘使用率已经下降到阈值以下。。 <img class=" lazyloaded" src="https://www.zsythink.net/wp-content/uploads/2017/01/010417_0238_14.png" alt="" data-src="https://www.zsythink.net/wp-content/uploads/2017/01/010417_0238_14.png" style=""> 同时,查看对应事件,触发器的状态也从”问题”重新变回了”正常”,即从”Problem”又变回了”OK”。 <img class=" ls-is-cached lazyloaded" src="https://www.zsythink.net/wp-content/uploads/2017/01/010417_0238_15.png" alt="" data-src="https://www.zsythink.net/wp-content/uploads/2017/01/010417_0238_15.png" style=""> 此时再次收到邮件,是触发器的状态恢复正常时发送的信息。 <img class=" ls-is-cached lazyloaded" src="https://www.zsythink.net/wp-content/uploads/2017/01/010417_0238_16.png" alt="" data-src="https://www.zsythink.net/wp-content/uploads/2017/01/010417_0238_16.png" style=""> 邮件内容如下。 <img class=" lazyloaded" src="https://www.zsythink.net/wp-content/uploads/2017/01/010417_0238_17.png" alt="" data-src="https://www.zsythink.net/wp-content/uploads/2017/01/010417_0238_17.png" style=""> 好了,我们已经收到了zabbix的正常报警信息,我想,现在我们已经能够初步的使用zabbix了。 转载自朱双印日志https://www.zsythink.net/archives/790 Last modification:May 29, 2024 © Allow specification reprint Like 如果觉得我的文章对你有用,请随意赞赏