zabbixでwebサイトのヘルスチェック監視を行っています。
webシナリオで設定したヘルスチェックファイルのURL(http://{HOST.HOST}.domain/filepath)を監視する形です。
なお、トリガーは下記のような設定です:
{テンプレート名:web.test.fail[シナリオ名].count(#3,1)}=3
この時たまにDNS名前解決ができなくなり、ヒストリに掲題の値ログを残しアラートを発報することがあります。
このエラーは一時的なもののようで、最大15-20分ほどで収束します。
上記のエラーが発生した時間帯の当該サーバのアクセスログを見ると問題なく200を返しており、webサイトでの障害はないようでした。
zabbixサーバから(なぜか)一時的に監視対象のホストの名前解決が失敗してしまうだけで、
実際にwebサイトへの影響がないので、アラートが出るのは本意ではありません。
これはトリガーの設定がうまくないでしょうか?
または、名前解決の失敗の発生自体を抑制する方法をとるのが現実的でしょうか?
(zabbixサーバの/etc/hostsに監視対象のサーバを列挙する、 DNSのローカルキャッシュを導入するetc)
ご助言いただけますでしょうか。