escalatorプロセスのbusy率について

July 3, 2019, 10:53 pm

zabbix2.2.8を使用しています。

以前は1%にも満たない値であったescalatorプロセスのbusy率が
ある日を境に50%～70%を推移するようになってしまいました。
(一時期は75%を超えていました)

http://www.zabbix.jp/node/3108
http://www.zabbix.jp/node/1905

上記の内容をみて調査をしたのですが、
escalationsのレコードも10件程度で特に問題ないように思えます。
他に何か原因等はあるのでしょうか？
もしくは何か対応方法等はありませんでしょうか？

また、escalatorプロセスのbusy率高い状態で
アクションにより数百件のアラートメールが送信されたのですが
アラートメールの送信時間が最大で15時間程度遅延しました。
最近も30件程度のアラート通知が15程度遅延しています。
この挙動はescalatorプロセスのbusy率高い状態が関係しているのでしょうか？

↧

NAT環境からのアラーム発報に関して

July 4, 2019, 2:46 am

≫ Next: aws上のzabbixエージェントは、セキュリティグループで10050ポートを開ける必要があるんでしょうか。

≪ Previous: escalatorプロセスのbusy率について

NAT環境からのアラーム発報に関して、ご質問させて下さい。

NAT環境にある機器から、Zabbix(4.0)へのアラームテストを実施しました。
1) DELLサーバのiDRACからのsnmpテストアラームは、問題なくZabbix GUIに障害として表示。
2) Juniper FWからのsnmpテストアラームは、問題なくZabbix GUIに障害として表示。
3) VMware ESXiからのsnmpテストアラームは、Zabbix GUIに何も障害として表示されない。

ESXiからは、下記のコマンドでsnmpテストアラームを発報
#esxcli system snmp test
192.168.0.1 :NAT変換前のIP
10.1.1.1 :NAT変換後のIP

ZabbixサーバのNICのinterface(eth0)でtcpdumpを行ったところ下記のログが表示され、snmpアラームはESXiから正常に発報されている。
[root@zabbix001 ~]# tcpdump -i eth0 host 10.1.1.1

↧

aws上のzabbixエージェントは、セキュリティグループで10050ポートを開ける必要があるんでしょうか。

July 4, 2019, 4:54 am

≫ Next: Windowsのファイル存在監視について

≪ Previous: NAT環境からのアラーム発報に関して

aws上にzabbixサーバ(4.07)
を構築し、zabbixエージェント(amazon linux)にてセキュリティグループに10050、10051をポートを開けるよう指定してやらないとzabbixエージェントは認識しないのでしょうか。

(切り分け)
・pingは、zabbixサーバとzabbixエージェント間で通信はあります。

・zabbixエージェントのlisten port
10051がみえません。

(環境)
■zabbix-agentd.conf設定
ListenPort=10050
ListenIP=xxx.xxx.xxx.118
ServerActive=xxx.xxx.xxx.193:10051
Hostname=ip-xxx-xxx-xxx-118.ap-northeast-1.compute.internal

■zabbix-server.conf設定
ListenPort=10051
ListenIP= xxx.xxx.xxx.193

↧

Windowsのファイル存在監視について

July 4, 2019, 10:17 pm

≫ Next: 通知メールで{TRIGGER.NAME}がそのままになる

≪ Previous: aws上のzabbixエージェントは、セキュリティグループで10050ポートを開ける必要があるんでしょうか。

いつもお世話になっております。
Windowsのファイル存在監視について、質問させてください。

Windowsにて、ファイルの存在監視を
実施しようと考えているのですがアイテムで
値が取れない事象が発生しております。
単純にアクセス権限が足りないとかであれば、ZabbixServer側で
「不明」のステータスになると思うのですが、ステータスは「有効」に
なっているため原因がわからなくなってしまいました。

最新データの内容を確認したのですが、データなしになっているため
ステータスは問題ないがデータは何も取ってきていないように見えます。

以下に、設定内容等の情報を記載させていただきますので
アドバイスをいただけますと助かります。

■サーバ情報(Zabbix Server)
OSバージョン：CentOS 7.6
Zabbixバージョン：4.0

■サーバ情報(Zabbix Agent)
OSバージョン：Windows2008Server

■アイテム定義
タイプ：Zabbixエージェント
キー：vfs.file.exists[C:\tmp\zabbix\〇〇〇\▲▲▲_yyyymmdd.DAT]
監視間隔：30s

何か設定が足りない等を教えてください。

死活監視等の基本的な監視は出来ているので

↧

通知メールで{TRIGGER.NAME}がそのままになる

July 7, 2019, 11:48 pm

≫ Next: ログ監視でのファイルサイズ制限について

≪ Previous: Windowsのファイル存在監視について

環境:Zabbix　Ver 4.0.10
Dockerのlocalで学習中です。

設定＞アクション - [実行内容]

件名とメッセージの編集箇所にて

{TRIGGER.NAME}
{TRIGGER.STATUS}
等を書いてみたのですが、通知されたメールには
{TRIGGER.NAME}
{TRIGGER.STATUS}
がそのまま出力されていました。

{HOST.HOST}
{HOST.IP}
等は
Host name: bee9beca2e88
Host IP: 172.22.0.6
と実値に置き換わりました。

何か設定しないと、TRIGGER.xxx は利用できないのでしょうか？

参考にしたdoc
https://www.zabbix.com/documentation/4.0/manual/appendix/macros/supporte...

↧

ログ監視でのファイルサイズ制限について

July 8, 2019, 12:54 am

≫ Next: snmpトラップでlinkUPが受信できなかった

≪ Previous: 通知メールで{TRIGGER.NAME}がそのままになる

ログ監視をしていますが、エラーが検知できない状況があります。

【問題】
以下2つのケースが問題と考えられます。
・監視対象のファイルが数GBになっているため。
・監視対象のファイルにエラーが1秒間隔で出力されていて、エラー量が多いため。（ファイルサイズは100MB以内）

ちなみにZabbixのコンソールでは、Latestデータでは検知していたりしていなかったりします。
Eventから見て、triggerでは全く検知はしません、当然アクションからメールの送信も行われません。

【環境】
Zabbixバージョン：Zabbix 3.0.28.
Zabbixサーバ： AWS Linux
監視対象サーバ： Windows server2012R2
監視方式： Zabbix agent active によるログ監視

【質問】
ログ監視対象のファイルが読み込めない、いわゆる監視できなくなる制限がファイルサイズやログの行数でありますでしょうか？

備考：
ちなみに、AWSのRDSというサービスに対する監視で、ログを監視対象サーバからダウンロードして、そのダウンロードしたファイルを監視しています。
5分置きにダウンロードしているため、毎回先頭からログ監視をしてしまう仕様です。
このため5分前に起きたエラーも検知されてしまいます。

↧

snmpトラップでlinkUPが受信できなかった

July 9, 2019, 12:43 am

≫ Next: グラフの左右のY軸の最大値の設定について

≪ Previous: ログ監視でのファイルサイズ制限について

初歩的なことお尋ねします。

snmpでlinkdownを受信し、トリガ発行され障害となっていますが、
該当機器を復旧させたときに、linkupをZABBIXで受信できず、
実際は正常に戻っているが、ZABBIX上障害のままとなっています。
このリセット方法をお正ていただけないでしょうか。

↧

グラフの左右のY軸の最大値の設定について

July 10, 2019, 1:41 am

≫ Next: Zabbix Agent2.4とWindows 2016について

≪ Previous: snmpトラップでlinkUPが受信できなかった

グラフのY軸の最小値・最大値について質問させてください。

Zabbix Server 4.0.7を利用しております。

違う単位のアイテムを重ねて1つのグラフに描画させているのですが、Y軸の値がコントロールできないため、少し見栄えが悪く改善したいと考えております。

具体的にはディスクの使用量と使用率を重ねて描画したいという状況です。
ディスクのパーティションはそれぞれ異なりますのでその値のY軸の最大値は「計算」に、使用率は100%が上限なのでY軸の最大値を固定で「100.00」にしたいのですが、このようなグラフは設定可能でしょうか。

現在は、アイテムの1に使用量を設定しY軸を左に、アイテムの2に使用率を設定しY軸を右に設定しています。
またY軸の最小値を固定で「0」に、最大値を「計算」にしております。
この状態ですと、使用量の最大値にひっぱられるのか右のY軸に描画させている率の方が最大値が300%となってしまいます。
何か良い案はありますでしょうか。

↧

Zabbix Agent2.4とWindows 2016について

July 10, 2019, 2:51 am

≫ Next: Zabbixのバージョン指定について

≪ Previous: グラフの左右のY軸の最大値の設定について

Zabbix Agent2.4とWindows 2016について、
質問させて頂きます。

【状況】
Zabbix ServerとZabbix Agent間でサーバのリソース監視を行っています。
このシステムに、Windows Server2016を新規導入することになりました。

現在と同じバージョンが使用できるのかわからず、
質問をさせて頂きました。

現行サーバに極力影響を与えずに、
Windows2016のリソース監視を行える方法がございましたら
ご教示頂きたく存じます。

【システム環境】
監視サーバ
Zabbix Server(2.4.5-1)
　OS:CentOS6

監視対象
Zabbix Agent(2.4.5-1)
　OS:Windows Server2012R2
→ここにWindows Server2016を追加したい

初歩的な質問で恐縮ですが、よろしくお願い致します。

↧

Zabbixのバージョン指定について

July 11, 2019, 7:32 pm

≫ Next: VMware ESXi データストアIOPSのLLDでの取得方法

≪ Previous: Zabbix Agent2.4とWindows 2016について

お世話になっております。
どちらかとOS上の問題になるかもしれないのですが、
ご教授頂きたく宜しくお願い致します。

【質問】
CentOS7.5環境に置いて"zabbix-release-3.4-1.el7.centos.noarch.rpm "を導入しております。
とある検証のため、現時点の最新Ver3.4.15ではなく、3.4.3のServer、Agentを導入したいのですが、
yumでバージョンを指定することは出来ますでしょうか、

↧

VMware ESXi データストアIOPSのLLDでの取得方法

July 11, 2019, 7:36 pm

≫ Next: Windowsイベント監視で特定のIDを抑止方法

≪ Previous: Zabbixのバージョン指定について

お世話になります。
LLDで検出したデータストアのIOPSを取得しようと試行錯誤していますが、実現できずにいます。
（実現できるのであればZabbixのバージョンは限定しませんが、今は4.0.10を使用しています）

この値は現状のZabbix側アイテムキーには用意されていないので、パフォーマンスカウンタから持ってくるしかなく、具体的には以下のようなキーになると思います。
vmware.hv.perfcounter[{$URL},{HOST.HOST},"datastore/datastoreReadIops[average]",{#DATASTORE}]

問題は,最後の{#DATASTORE}が、データストア名ではなくUUIDで書かれなければならないようだということです。
データストアのUUIDを検出するディスカバリキー({#DATASTORE.UUID}のような)が今のところ存在しないため、
アイテムを1つずつ手動で作成する以外に解決策が見いだせない状況です。

あとは各HVでSSHシェルを有効化した上、userparameterを駆使して名前とUUIDを変換するといった強引な方法ぐらいしか思いつきません。
こういった、パフォーマンスカウンタ経由でのデータストアの値取得について、良い方法はありませんでしょうか。

↧

Windowsイベント監視で特定のIDを抑止方法

July 15, 2019, 11:02 pm

≫ Next: 特定の画面のみ閲覧許可する権限設定

≪ Previous: VMware ESXi データストアIOPSのLLDでの取得方法

いつもお世話になっております。

テンプレートを使用して、各サーバのApplicationイベントログ監視をしており
エラーレベルErrorのイベントを検出時にトリガー発報するよう設定しています。

その上で以下の内容を実現したく、ご教授お願いいたします。

【実現したい内容】
・特定のイベントIDではアラートをあげないよう抑止する
・抑止するイベントIDはホストによって異なるため、ホストマクロにて設定する
・ステータスを常に「障害」状態で運用する
(抑止イベントIDが検出された場合、「正常」に戻らない設計にしたい)
→障害復旧は、「障害対応コメント」を入力することにより判断しているため

現在、以下のようにアイテム/トリガー設定していますが
抑止イベントID検出時に、ステータスが「正常」に戻ってしまいます。
アイテム：eventlog[Application,,"Critical|Error"]
トリガー：{Template_Name:eventlog[Application,,"Critical|Error"].logseverity(4)}=4
and
{Template_Name:eventlog[Application,,"Critical|Error"].logeventid({$APP_ERR_ID})}<>1

↧

特定の画面のみ閲覧許可する権限設定

July 15, 2019, 11:42 pm

≫ Next: Webシナリオを任意のタイミングで実行したい

≪ Previous: Windowsイベント監視で特定のIDを抑止方法

権限について教えてください。
以前どこかで同様の質問がある場合は、そちらを教えていただけますと助かります。
いくつかのグラフをスクリーンページでまとめたのですが、
このスクリーンページのみを閲覧許可するようなユーザもしくはユーザグループの権限設定はできますでしょうか。
できればDashboardやOverviewというアイテムも非表示にしたいのですが、
それでなかれば押せるけどデータが表示されない、でもいいかと思っています。

グループの権限にて、特定のホストグループのみ表示を許可にしましたが、
これではOverviewの画面も表示されてしまいます。

よろしくお願いいたします。

↧

Webシナリオを任意のタイミングで実行したい

July 16, 2019, 9:52 pm

≫ Next: Network機器からsnmpwalkで得た結果の行数をカウントしたい

≪ Previous: 特定の画面のみ閲覧許可する権限設定

お世話になります。

Zabbix 3.0.7でWeb監視を利用しております。

Webシナリオには更新間隔(秒)が設定できますが、
これを周期的な間隔でなく任意のタイミング（一度きり）で実行したいと考えています。

APIやコマンドラインなどで実行することは可能でしょうか。
または何か良い案はありますでしょうか。

↧

Network機器からsnmpwalkで得た結果の行数をカウントしたい

July 17, 2019, 1:57 am

≫ Next: ヒストリーアイテム（ログやテキスト）の表示順について

≪ Previous: Webシナリオを任意のタイミングで実行したい

--------------------
CentOS 7.6
Zabbix 4.0.10
--------------------

Zabbix Server -> Zabbix Proxy -> Network機器

上記構成にてNetwork機器からARPのエントリを取得したく
Zabbix ProxyからipNetToMediaPhysAddress (OID: .1.3.6.1.2.1.4.22.1.2)を
snmpwalkすると以下のような結果が得られます。

IP-MIB::ipNetToMediaPhysAddress.16.172.16.8.10 = STRING: 0:17:2e:9a:88:18
IP-MIB::ipNetToMediaPhysAddress.16.172.16.8.11 = STRING: 0:17:2e:9a:88:30
IP-MIB::ipNetToMediaPhysAddress.16.172.16.8.12 = STRING: 0:17:2e:9a:88:28
IP-MIB::ipNetToMediaPhysAddress.16.172.16.8.13 = STRING: 0:17:2e:9a:88:24

↧

ヒストリーアイテム（ログやテキスト）の表示順について

July 17, 2019, 6:18 pm

≫ Next: Zabbixダッシュボードに表示されている内容について

≪ Previous: Network機器からsnmpwalkで得た結果の行数をカウントしたい

ヒストリーアイテム（ログやテキスト）の表示順ですが、降順ではなく昇順で表示する方法はないでしょうか？
取り込ませたログを上から下へと参照したいです（プレーンテキストも同様）

Zabbix 3.4.15
mysql 5.6
centos 7(64bit)

↧

Zabbixダッシュボードに表示されている内容について

July 17, 2019, 11:49 pm

≫ Next: プロキシでグローバルスクリプトを実行させたい

≪ Previous: ヒストリーアイテム（ログやテキスト）の表示順について

現在Zabbix2.2を使用しており、下記の画面が表示されております。
Zabbixに詳しい方から見ると、このZabbixの活用/運用方法に何か問題はあるでしょうか？
(「重度の障害:4590件」や「障害あり:1400件」の件数が多く、この使い方で正しいのか疑問に思い投稿致しました)

何かアドバイス等頂ければ幸いです。よろしくお願いします。

> ○Zabbixサーバの状態
> パラメータ値詳細
> ホスト数 (有効/無効/テンプレート) 2783 2739 / 16 / 28
> アイテム数 (有効/無効/取得不可) 75104 48769 / 25663 / 672
> トリガー数 (有効/無効)[障害/不明/正常] 38376 35562 / 2814 [4697 / 0 / 30865]
> 1秒あたりの監視項目数(Zabbixサーバーの要求パフォーマンス) 5285.86
> ○システムステータス
> ホストグループ致命的な障害重度の障害軽度の障害警告情報未分類
> Servers 0 4590 0 102 0 0
> 更新時刻: 15:30:40

↧

プロキシでグローバルスクリプトを実行させたい

July 22, 2019, 7:25 pm

≫ Next: ログ監視の誤検知について

≪ Previous: Zabbixダッシュボードに表示されている内容について

--------------------
CentOS 7.6
Zabbix-server 4.0.10
Zabbix-proxy 4.0.10
--------------------

グローバルスクリプトをZabbixプロキシで実行させたいと考えております。
[管理]→[スクリプト]でスクリプトを作成する際、
次で実行の項目に"Zabbixサーバーまたはプロキシ"とありますがこの項目を選んでもプロキシで実行されません。
プロキシで実行させるにはどのように設定すればよろしいでしょうか？

ご教授のほどよろしくお願いいたします。

↧

ログ監視の誤検知について

July 23, 2019, 12:44 am

≫ Next: Windows Server 2013 ログオン監視

≪ Previous: プロキシでグローバルスクリプトを実行させたい

過去のログを２度、検知してしまう現象が発生しています。
ヒストリを見る限り

ヒストリ
-------------------
タイムスタンプローカル時間
2019/7/19 23:10:53 2019/06/13 23:05:48
2019/06/13 23:10:48 2019/06/13 23:05:48
-------------------

と表示されているので、同じ値を２度に渡り、検知している事が確認できています。
アイテム、トリガーの設定では、特段、変わった設定をしているわけではないと思っています。

アイテム
-------------------
キー設定 log[D:\AAA\log\info.log,XXXX,SHIFT_JIS,]
更新間隔 300s
ヒストリ保存期間 90d
ログの時間の形式 yyyy/MM/dd hh:mm:ss
-------------------

トリガー
-------------------
条件式 {Template:log[D:\AAA\log\info.log,XXXX,SHIFT_JIS,].str(XXXX)}=1 or {Template:log[D:\AAA\log\error.log,XXXX,SHIFT_JIS,].str(XXXX)}=1

↧

Windows Server 2013 ログオン監視

July 23, 2019, 11:08 pm

≫ Next: ログ監視・集計における特定キーワードの除外方法について

≪ Previous: ログ監視の誤検知について

最近、前任者から引き継ぎ、zabbixを利用しシステム監視を行なっている者です。
表題の通り
Windows Server 2013へのログオン監視のやり方で困ってます。
Windowsのイベントログより、イベントIDを基準とし
対象のイベントIDがあった場合にアラートをあげたいと考えてます。

新たな監視を設定する手順など引き継がれなかったもので
何が何だかさっぱりで今に至ります。

zabbix 4.0.5

アイテム
キー
eventlog［Security,,,Microsoft Windows security auditing,4326,,］

アプリケーション
なし

↧