確認させていただきたいことがあります。
Zabbix 5.0
OS:RHEL7
Zabbix を使用して監視運用していますが、運用者がトリガーやアクションを有効化し忘れてしまったことで、
障害に気が付けない事故が発生しました。
暫定運用として、Zabbix ダッシュボードの画面から、無効化があるかを確認していますが、
作業や別件障害により暫定的に無効化にしている数が多く、
無効化されていて問題ないものとの切り分けを目視でするのが手間がかかっています。
できれば、自動化で対応したいのですが、以下のような案しか思いつきません。
もうちょっとスマートは方法を探っているところです。
・mysql のテーブルから無効化項目を抽出して、無効化で問題ないリストファイルと突合せてアラートを上げるスクリプトを作成する(cron)
・無効化の数をSQLで抽出して、1日1回、朝方にチェックして、前回から値が変わっていればアラートとするアイテムとトリガーを作成
同じような悩みを抱えていて、このような対応した。とかのナレッジがあればぜひ共有していただきたいです。
API がアイテムで使えればいいかなとも思っているのですが、思い浮かばず。。