現在、Zabbixで稼働しているサーバを監視しております。
監視内容は、各アイテムに閾値を設定した監視と、一定時間内にデータの取得がなければ、アラートを上げる設定をしております。
定期的に、アラートと復旧の連絡が同じタイミングで発報する事象が発生しております。
認識といたしましては、監視間隔(8m)とnodataを判定する時間(16m)で十分に間隔をあけておりますので、問題ないと認識しております。
本事象の原因および解決方法をご存じでしたら、ご教授いただけますでしょうか。
調査にあたり、追加で必要な情報がございましたら、ご連絡ください。
可能な範囲で情報を共有させていただきます。
<設定内容>
◆アイテム
アイテムキー:vfs.fs.size[c:\,pused]
監視間隔:8m
◆トリガー(1アイテムに2つ設定しております。)
トリガー①:{hostname:vfs.fs.size[c:\,pused].last()}>=95
トリガー②:{hostname:vfs.fs.size[c:\,pused].nodata(960)}=1
<暫定対応>
サーバにインストールしているZabbixAgentを再起動いたしますと、事象が改善されました。
<構築環境>
Zabbixサーバ:AWSのEC2(CentOS)