Quantcast
Channel: 日本Zabbixユーザー会 - 日本Zabbixユーザー会フォーラム
Viewing all 1854 articles
Browse latest View live

escalatorプロセスのbusy率について

$
0
0

zabbix2.2.8を使用しています。

以前は1%にも満たない値であったescalatorプロセスのbusy率が
ある日を境に50%~70%を推移するようになってしまいました。
(一時期は75%を超えていました)

http://www.zabbix.jp/node/3108
http://www.zabbix.jp/node/1905

上記の内容をみて調査をしたのですが、
escalationsのレコードも10件程度で特に問題ないように思えます。
他に何か原因等はあるのでしょうか?
もしくは何か対応方法等はありませんでしょうか?

また、escalatorプロセスのbusy率高い状態で
アクションにより数百件のアラートメールが送信されたのですが
アラートメールの送信時間が最大で15時間程度遅延しました。
最近も30件程度のアラート通知が15程度遅延しています。
この挙動はescalatorプロセスのbusy率高い状態が関係しているのでしょうか?


NAT環境からのアラーム発報に関して

$
0
0

NAT環境からのアラーム発報に関して、ご質問させて下さい。

NAT環境にある機器から、Zabbix(4.0)へのアラームテストを実施しました。
1) DELLサーバのiDRACからのsnmpテストアラームは、問題なくZabbix GUIに障害として表示。
2) Juniper FWからのsnmpテストアラームは、問題なくZabbix GUIに障害として表示。
3) VMware ESXiからのsnmpテストアラームは、Zabbix GUIに何も障害として表示されない。

ESXiからは、下記のコマンドでsnmpテストアラームを発報
#esxcli system snmp test
192.168.0.1 :NAT変換前のIP
10.1.1.1 :NAT変換後のIP

ZabbixサーバのNICのinterface(eth0)でtcpdumpを行ったところ下記のログが表示され、snmpアラームはESXiから正常に発報されている。
[root@zabbix001 ~]# tcpdump -i eth0 host 10.1.1.1

続きを読む

aws上のzabbixエージェントは、セキュリティグループで10050ポートを開ける必要があるんでしょうか。

$
0
0

aws上にzabbixサーバ(4.07)
を構築し、zabbixエージェント(amazon linux)にてセキュリティグループに10050、10051をポートを開けるよう指定してやらないとzabbixエージェントは認識しないのでしょうか。

(切り分け)
・pingは、zabbixサーバとzabbixエージェント間で通信はあります。

・zabbixエージェントのlisten port
10051がみえません。

(環境)
■zabbix-agentd.conf設定
ListenPort=10050
ListenIP=xxx.xxx.xxx.118
ServerActive=xxx.xxx.xxx.193:10051
Hostname=ip-xxx-xxx-xxx-118.ap-northeast-1.compute.internal

■zabbix-server.conf設定
ListenPort=10051
ListenIP= xxx.xxx.xxx.193

Windowsのファイル存在監視について

$
0
0

いつもお世話になっております。
Windowsのファイル存在監視について、質問させてください。

Windowsにて、ファイルの存在監視を
実施しようと考えているのですがアイテムで
値が取れない事象が発生しております。
単純にアクセス権限が足りないとかであれば、ZabbixServer側で
「不明」のステータスになると思うのですが、ステータスは「有効」に
なっているため原因がわからなくなってしまいました。

最新データの内容を確認したのですが、データなしになっているため
ステータスは問題ないがデータは何も取ってきていないように見えます。

以下に、設定内容等の情報を記載させていただきますので
アドバイスをいただけますと助かります。

■サーバ情報(Zabbix Server)
OSバージョン:CentOS 7.6
Zabbixバージョン:4.0

■サーバ情報(Zabbix Agent)
OSバージョン:Windows2008Server

■アイテム定義
タイプ:Zabbixエージェント
キー:vfs.file.exists[C:\tmp\zabbix\〇〇〇\▲▲▲_yyyymmdd.DAT]
監視間隔:30s

何か設定が足りない等を教えてください。

死活監視等の基本的な監視は出来ているので

続きを読む

通知メールで{TRIGGER.NAME}がそのままになる

$
0
0

環境:Zabbix Ver 4.0.10
Dockerのlocalで学習中です。

設定>アクション - [実行内容]

件名とメッセージの編集箇所にて

{TRIGGER.NAME}
{TRIGGER.STATUS}
等を書いてみたのですが、通知されたメールには
{TRIGGER.NAME}
{TRIGGER.STATUS}
がそのまま出力されていました。

{HOST.HOST}
{HOST.IP}
等は
Host name: bee9beca2e88
Host IP: 172.22.0.6
と実値に置き換わりました。

何か設定しないと、TRIGGER.xxx は利用できないのでしょうか?

参考にしたdoc
https://www.zabbix.com/documentation/4.0/manual/appendix/macros/supporte...

ログ監視でのファイルサイズ制限について

$
0
0

ログ監視をしていますが、エラーが検知できない状況があります。

【問題】
以下2つのケースが問題と考えられます。
・監視対象のファイルが数GBになっているため。
・監視対象のファイルにエラーが1秒間隔で出力されていて、エラー量が多いため。(ファイルサイズは100MB以内)

ちなみにZabbixのコンソールでは、Latestデータでは検知していたりしていなかったりします。
Eventから見て、triggerでは全く検知はしません、当然アクションからメールの送信も行われません。

【環境】
Zabbixバージョン:Zabbix 3.0.28.
Zabbixサーバ: AWS Linux
監視対象サーバ: Windows server2012R2
監視方式: Zabbix agent active によるログ監視

【質問】
ログ監視対象のファイルが読み込めない、いわゆる監視できなくなる制限がファイルサイズやログの行数でありますでしょうか?

備考:
ちなみに、AWSのRDSというサービスに対する監視で、ログを監視対象サーバからダウンロードして、そのダウンロードしたファイルを監視しています。
5分置きにダウンロードしているため、毎回先頭からログ監視をしてしまう仕様です。
このため5分前に起きたエラーも検知されてしまいます。

続きを読む

snmpトラップでlinkUPが受信できなかった

$
0
0

初歩的なことお尋ねします。

snmpでlinkdownを受信し、トリガ発行され障害となっていますが、
該当機器を復旧させたときに、linkupをZABBIXで受信できず、
実際は正常に戻っているが、ZABBIX上障害のままとなっています。
このリセット方法をお正ていただけないでしょうか。

グラフの左右のY軸の最大値の設定について

$
0
0

グラフのY軸の最小値・最大値について質問させてください。

Zabbix Server 4.0.7を利用しております。

違う単位のアイテムを重ねて1つのグラフに描画させているのですが、Y軸の値がコントロールできないため、少し見栄えが悪く改善したいと考えております。

具体的にはディスクの使用量と使用率を重ねて描画したいという状況です。
ディスクのパーティションはそれぞれ異なりますのでその値のY軸の最大値は「計算」に、使用率は100%が上限なのでY軸の最大値を固定で「100.00」にしたいのですが、このようなグラフは設定可能でしょうか。

現在は、アイテムの1に使用量を設定しY軸を左に、アイテムの2に使用率を設定しY軸を右に設定しています。
またY軸の最小値を固定で「0」に、最大値を「計算」にしております。
この状態ですと、使用量の最大値にひっぱられるのか右のY軸に描画させている率の方が最大値が300%となってしまいます。
何か良い案はありますでしょうか。


Zabbix Agent2.4とWindows 2016について

$
0
0

Zabbix Agent2.4とWindows 2016について、
質問させて頂きます。

【状況】
Zabbix ServerとZabbix Agent間でサーバのリソース監視を行っています。
このシステムに、Windows Server2016を新規導入することになりました。

現在と同じバージョンが使用できるのかわからず、
質問をさせて頂きました。

現行サーバに極力影響を与えずに、
Windows2016のリソース監視を行える方法がございましたら
ご教示頂きたく存じます。

【システム環境】
監視サーバ
Zabbix Server(2.4.5-1)
 OS:CentOS6

監視対象
Zabbix Agent(2.4.5-1)
 OS:Windows Server2012R2
→ここにWindows Server2016を追加したい

初歩的な質問で恐縮ですが、よろしくお願い致します。

Zabbixのバージョン指定について

$
0
0

お世話になっております。
どちらかとOS上の問題になるかもしれないのですが、
ご教授頂きたく宜しくお願い致します。

【質問】
CentOS7.5環境に置いて"zabbix-release-3.4-1.el7.centos.noarch.rpm "を導入しております。
とある検証のため、現時点の最新Ver3.4.15ではなく、3.4.3のServer、Agentを導入したいのですが、
yumでバージョンを指定することは出来ますでしょうか、

VMware ESXi データストアIOPSのLLDでの取得方法

$
0
0

お世話になります。
LLDで検出したデータストアのIOPSを取得しようと試行錯誤していますが、実現できずにいます。
(実現できるのであればZabbixのバージョンは限定しませんが、今は4.0.10を使用しています)

この値は現状のZabbix側アイテムキーには用意されていないので、パフォーマンスカウンタから持ってくるしかなく、具体的には以下のようなキーになると思います。
vmware.hv.perfcounter[{$URL},{HOST.HOST},"datastore/datastoreReadIops[average]",{#DATASTORE}]

問題は,最後の{#DATASTORE}が、データストア名ではなくUUIDで書かれなければならないようだということです。
データストアのUUIDを検出するディスカバリキー({#DATASTORE.UUID}のような)が今のところ存在しないため、
アイテムを1つずつ手動で作成する以外に解決策が見いだせない状況です。

あとは各HVでSSHシェルを有効化した上、userparameterを駆使して名前とUUIDを変換するといった強引な方法ぐらいしか思いつきません。
こういった、パフォーマンスカウンタ経由でのデータストアの値取得について、良い方法はありませんでしょうか。

Windowsイベント監視で特定のIDを抑止方法

$
0
0

いつもお世話になっております。

テンプレートを使用して、各サーバのApplicationイベントログ監視をしており
エラーレベルErrorのイベントを検出時にトリガー発報するよう設定しています。

その上で以下の内容を実現したく、ご教授お願いいたします。

【実現したい内容】
・特定のイベントIDではアラートをあげないよう抑止する
・抑止するイベントIDはホストによって異なるため、ホストマクロにて設定する
・ステータスを常に「障害」状態で運用する
(抑止イベントIDが検出された場合、「正常」に戻らない設計にしたい)
→障害復旧は、「障害対応コメント」を入力することにより判断しているため

現在、以下のようにアイテム/トリガー設定していますが
抑止イベントID検出時に、ステータスが「正常」に戻ってしまいます。
アイテム:eventlog[Application,,"Critical|Error"]
トリガー:{Template_Name:eventlog[Application,,"Critical|Error"].logseverity(4)}=4
and
{Template_Name:eventlog[Application,,"Critical|Error"].logeventid({$APP_ERR_ID})}<>1

続きを読む

特定の画面のみ閲覧許可する権限設定

$
0
0

権限について教えてください。
以前どこかで同様の質問がある場合は、そちらを教えていただけますと助かります。
いくつかのグラフをスクリーンページでまとめたのですが、
このスクリーンページのみを閲覧許可するようなユーザもしくはユーザグループの権限設定はできますでしょうか。
できればDashboardやOverviewというアイテムも非表示にしたいのですが、
それでなかれば押せるけどデータが表示されない、でもいいかと思っています。

グループの権限にて、特定のホストグループのみ表示を許可にしましたが、
これではOverviewの画面も表示されてしまいます。

よろしくお願いいたします。

Webシナリオを任意のタイミングで実行したい

$
0
0

お世話になります。

Zabbix 3.0.7でWeb監視を利用しております。

Webシナリオには更新間隔(秒)が設定できますが、
これを周期的な間隔でなく任意のタイミング(一度きり)で実行したいと考えています。

APIやコマンドラインなどで実行することは可能でしょうか。
または何か良い案はありますでしょうか。

Network機器からsnmpwalkで得た結果の行数をカウントしたい

$
0
0

--------------------
CentOS 7.6
Zabbix 4.0.10
--------------------

Zabbix Server -> Zabbix Proxy -> Network機器

上記構成にてNetwork機器からARPのエントリを取得したく
Zabbix ProxyからipNetToMediaPhysAddress (OID: .1.3.6.1.2.1.4.22.1.2)を
snmpwalkすると以下のような結果が得られます。

IP-MIB::ipNetToMediaPhysAddress.16.172.16.8.10 = STRING: 0:17:2e:9a:88:18
IP-MIB::ipNetToMediaPhysAddress.16.172.16.8.11 = STRING: 0:17:2e:9a:88:30
IP-MIB::ipNetToMediaPhysAddress.16.172.16.8.12 = STRING: 0:17:2e:9a:88:28
IP-MIB::ipNetToMediaPhysAddress.16.172.16.8.13 = STRING: 0:17:2e:9a:88:24

続きを読む


ヒストリーアイテム(ログやテキスト)の表示順について

$
0
0

ヒストリーアイテム(ログやテキスト)の表示順ですが、降順ではなく昇順で表示する方法はないでしょうか?
取り込ませたログを上から下へと参照したいです(プレーンテキストも同様)

Zabbix 3.4.15
mysql 5.6
centos 7(64bit)

Zabbixダッシュボードに表示されている内容について

$
0
0

現在Zabbix2.2を使用しており、下記の画面が表示されております。
Zabbixに詳しい方から見ると、このZabbixの活用/運用方法に何か問題はあるでしょうか?
(「重度の障害:4590件」や「障害あり:1400件」の件数が多く、この使い方で正しいのか疑問に思い投稿致しました)

何かアドバイス等頂ければ幸いです。よろしくお願いします。

> ○Zabbixサーバの状態
> パラメータ 値 詳細
> ホスト数 (有効/無効/テンプレート) 2783 2739 / 16 / 28
> アイテム数 (有効/無効/取得不可) 75104 48769 / 25663 / 672
> トリガー数 (有効/無効)[障害/不明/正常] 38376 35562 / 2814 [4697 / 0 / 30865]
> 1秒あたりの監視項目数(Zabbixサーバーの要求パフォーマンス) 5285.86
> ○システムステータス
> ホストグループ 致命的な障害 重度の障害 軽度の障害 警告 情報 未分類
> Servers 0 4590 0 102 0 0
> 更新時刻: 15:30:40

続きを読む

プロキシでグローバルスクリプトを実行させたい

$
0
0

--------------------
CentOS 7.6
Zabbix-server 4.0.10
Zabbix-proxy 4.0.10
--------------------

グローバルスクリプトをZabbixプロキシで実行させたいと考えております。
[管理]→[スクリプト]でスクリプトを作成する際、
次で実行の項目に"Zabbixサーバーまたはプロキシ"とありますがこの項目を選んでもプロキシで実行されません。
プロキシで実行させるにはどのように設定すればよろしいでしょうか?

ご教授のほどよろしくお願いいたします。

ログ監視の誤検知について

$
0
0

過去のログを2度、検知してしまう現象が発生しています。
ヒストリを見る限り

ヒストリ
-------------------
タイムスタンプ ローカル時間
2019/7/19 23:10:53 2019/06/13 23:05:48
2019/06/13 23:10:48 2019/06/13 23:05:48
-------------------

と表示されているので、同じ値を2度に渡り、検知している事が確認できています。
アイテム、トリガーの設定では、特段、変わった設定をしているわけではないと思っています。

アイテム
-------------------
キー設定 log[D:\AAA\log\info.log,XXXX,SHIFT_JIS,]
更新間隔 300s
ヒストリ保存期間 90d
ログの時間の形式 yyyy/MM/dd hh:mm:ss
-------------------

トリガー
-------------------
条件式 {Template:log[D:\AAA\log\info.log,XXXX,SHIFT_JIS,].str(XXXX)}=1 or {Template:log[D:\AAA\log\error.log,XXXX,SHIFT_JIS,].str(XXXX)}=1

続きを読む

Windows Server 2013 ログオン監視

$
0
0

最近、前任者から引き継ぎ、zabbixを利用しシステム監視を行なっている者です。
表題の通り
Windows Server 2013へのログオン監視のやり方で困ってます。
Windowsのイベントログより、イベントIDを基準とし
対象のイベントIDがあった場合にアラートをあげたいと考えてます。

新たな監視を設定する手順など引き継がれなかったもので
何が何だかさっぱりで今に至ります。

zabbix 4.0.5

アイテム
キー
eventlog[Security,,,Microsoft Windows security auditing,4326,,]

アプリケーション
なし

Viewing all 1854 articles
Browse latest View live


<script src="https://jsc.adskeeper.com/r/s/rssing.com.1596347.js" async> </script>