いつもお世話になっております。v3.0.14を使用しています。
トリガー:{node01:http.get.count(#2,200,ne)}=2 or {node01:http.get.nodata(60)}=1
「http.get」はcurlコマンドをユーザーパラメータで使用し、とあるURLにリクエストを投げてそのステータスコードを取得するアイテムです。
当初は最初の条件式のみで30秒間隔でポーリングしていましたがある日、原因不明ですが数分間値が取得できていないタイミングがあり、
異常が発生していたのを見逃してしまったという出来事がありました。
そのため、2つ目の条件式も追加し60秒間値が取得できていない場合も障害と判定するトリガーを作成しました。
悩んでいるのはnodataで検知した場合のアクション(メール通知)ですが、メッセージ中で以下のように指定しているのですが
-----
発生時刻 :{EVENT.DATE} {EVENT.TIME}
対象ノード:{HOSTNAME}
アラーム :{TRIGGER.NAME}
ステータス:{TRIGGER.VALUE}
内容 :{ITEM.VALUE}
-----
・{TRIGGER.VALUE} → どっちの条件式で障害と判定されたのか不明