ディスクのマウントが外れるのをZabbixで検知したい

August 28, 2019, 10:11 pm

≫ Next: メンテナンス期間中に発生した障害がメンテナンス終了後まで継続した場合の挙動差異について

お世話になります。

Windowsサーバの監視をしておりまして、Windowsサーバの再起動のタイミングなどで
たとえばDドライブのマウントが外れることがあります。
このマウントが外れるのをZabbixで検知したいです。
Zabbixは3.0です。

Zabbixのドキュメントでは3.0ではトリガーの関数nodataは値が取れないことは評価されないとあり、
どうすればマウントが外れたのを検知できるのかと検討しております。
こちらにつきましてアドバイスをいただければと存じます。

たとえば、監視対象のWindowsに対し、powershellスクリプトでディスク一覧をリモートコマンドで
発行・取得して、Zabbixでディスク数はいくつかを評価すると思いついたのですが、
ドライブの構成が変わる度に設定を変更することになるため、これは避けたいと考えております。

以上、よろしくお願いいたします。

↧

メンテナンス期間中に発生した障害がメンテナンス終了後まで継続した場合の挙動差異について

August 29, 2019, 1:56 am

≫ Next: 特定の条件を満たしたもの文字変換

≪ Previous: ディスクのマウントが外れるのをZabbixで検知したい

Zabbix 2.0.3 から Zabbix 4系 (4.0.11) への移行に向けて、旧サーバに並行する形で新サーバの構築を行っています。
旧サーバの設定と同じものを新サーバに構築し、並行して稼働させていく中で、メンテナンスに関連するあるシチュエーションでの挙動に差異があることが分かりました。

↧

特定の条件を満たしたもの文字変換

September 3, 2019, 2:21 am

≫ Next: nodata関数の動作について

≪ Previous: メンテナンス期間中に発生した障害がメンテナンス終了後まで継続した場合の挙動差異について

【最新値が１５以上】
host:web.test.time[scenario,resp].last()>15
の条件を満たしたとき　→　”X”
”X”という数字へ変換する

という構文は作成可能なのでしょうか。

アイテム：計算
で作成しようと試みています。

↧

nodata関数の動作について

September 3, 2019, 11:55 pm

≫ Next: グラフ表示のあいまいさについて

≪ Previous: 特定の条件を満たしたもの文字変換

Zabbix1.8から4.0への移行を検討中です。
移行に伴いアイテム/トリガーの設定内容は極力引き継ぐ予定です。

ログ監視において1.8と同様のトリガーでは障害として検出できないケースがありました。
1.8/4.0いずれも下記トリガーを設定して検証したところやはり4.0では障害と判断されませんでした。

nodata関数の変更等ありましたでしょうか
また、実現のための条件式をご教授いただけますと幸いです。

・検証したトリガー
　条件式
　　{hostname:logrt[C:\log\test_.*.log,ERROR].nodata(30)}=0
　正常イベントの生成
　　条件式
　障害イベント生成モード
　　単一

・実現したいこと
ERRORが含まれる行を障害として検知する。その後ERRORが一定時間出力されていなければ復旧する。

↧

グラフ表示のあいまいさについて

September 4, 2019, 2:09 am

≫ Next: グラフ表示　「今日」と「最新の1日間」での表示の違いについて

≪ Previous: nodata関数の動作について

識者各位

いつも勉強させていただいております。
Zabbixのグラフ表示について、いつも気になっている点があります。

ある一定の期間におけるグラフと、その最新/最小/平均/最大値を表示したとき、
X軸の期間を広くとってしまうと、グラフのY軸が、最大値を反映してくれないことがあります。
（期間を狭めれば、ある程度の時点から反映されます）。

添付「20190904000.jp」はトラフィック量の計測結果なのですが、
いずれのデータも何十～何百Mbpsの最大値を記録しているにもかかわらず、Y軸の最大は70Mbpsまでしか表示してくれません。
X軸の期間が広すぎると、Y軸がかなり大雑把であいまいになってしまうのは、Zabbixの仕様で、あきらめるしかないでしょうか。

Zabbixサーバーのバージョンは4.0.3です。
恐れ入りますがご教示いただけますと幸いです。

↧

グラフ表示　「今日」と「最新の1日間」での表示の違いについて

September 4, 2019, 4:45 am

≫ Next: Dashboard 画面上の　障害一覧の　表示内容について

≪ Previous: グラフ表示のあいまいさについて

ZABBIX4.0のグラフ表示差異についてろ質問いたします。

ZABBIXバージョン　4.0.10

トラフィックデータのグラフを表示させた際に、「今日」と選択した場合と「最新の1日間」と選択した場合で、
グラフ表示に差異が発生する場合があります。

正しく表示される場合もありますが、おかしくなる場合もあります。

「今日」のグラフ表示と
「最新の1日間」グラフ表示のファイルを添付します。

以前このフォーラムの投稿に、指定する期間が違うと計算方式の仕様等で長い期間の場合グラフの表示が少なく数値で表現されるとありました。http://www.zabbix.jp/node/1564

今回は期間がほぼ同じなので、該当しないと考えており、なぜこのようが現象が発生するのかが不明なのです。
この現象を回避方法等ありますでしょうか？
どなたかご存知の方がいらいたらご教授ください。

よろしくお願いいたします。

↧

Dashboard 画面上の　障害一覧の　表示内容について

September 4, 2019, 4:24 pm

≫ Next: 障害時のポップアップ/ブザー音が表示されない

≪ Previous: グラフ表示　「今日」と「最新の1日間」での表示の違いについて

いつもお世話になります。

Dashboard　画面上の　障害ウイジェットの　表示内容についてご存じの方がいらっしゃいましたら教えてください。

この障害ウイジェットの中には、

時間、復旧時刻、ステータス、情報、ホスト、障害 • 深刻度、継続期間、確認済　といった項目があるのですが、

この中の　“情報”　には、どういったものが表示されるのでしょうか？
ここに、表示させる内容を任意に変更することは可能なのでしょうか？
できれば、ここにホストのインベントリ情報を表示させたいと思っています。

ご教授いただければと思います。
よろしくお願いいたします。

↧

障害時のポップアップ/ブザー音が表示されない

September 4, 2019, 7:06 pm

≫ Next: 4.2のPrometheusからの値取得について

≪ Previous: Dashboard 画面上の　障害一覧の　表示内容について

アラート発生時にポップアップ/ブザー音が表示されない事象が発生しました。
ユーザプロファイルのアラート表示タブの設定はチェックをしており問題ありません。

発生時間と復旧時刻が同一のもの
(即時に復旧し、解決済みになったもの)
に関して、上記事象が出ているように見えます。
zabbixの既存のバグであったりしますでしょうか。

経緯
監視オペが右上ポップアップ、ブザー音をけいきに
ユーザへ電話、メール確認をしていますが、
ブザー音がならなったため、
監視データ⇒障害の画面を見て、初めて初動が遅れていたことに気づいた。
即時解決済みになっていても、確認対応はしないといけない

↧

4.2のPrometheusからの値取得について

September 5, 2019, 5:56 pm

≫ Next: zabbixのイベントログのAPIによる取得について

≪ Previous: 障害時のポップアップ/ブザー音が表示されない

お世話になります。
Zabbix4.2のPrometheusから取得した値によるLLDを試していますが、仕様上困った点があります。

本家サイトのマニュアルによると、保存前処理でPrometheus to JSONを行った後で
そのJSONに対してLLDなどの処理を行うとなっています。（以下）
https://zabbix.com/documentation/4.2/manual/discovery/low_level_discover...

が、おそらくはこのPrometheus to JSONの仕様で、
「Prometheus側でのメトリクス名＝JSON側ではname:という変数名」に決め打ちされてしまいます。
（上のURLで言うところの"name": "wmi_logical_disk_free_bytes"です)

これで何が困るかというと、元のPrometheus側でnameというラベルを既に使っていた場合です。
JSONに変換すると、メトリクス名もラベル名も同じname:変数にされてしまい、その後の処理が進みません。

Zabbix側の正規表現で置換等できないかとも思ったんですが、最初に一致した1つだけなら置換できたものの
一致した全ての項目を置換する方法が見つけられませんでした。

↧

zabbixのイベントログのAPIによる取得について

September 5, 2019, 6:19 pm

≫ Next: ESXiから外部チェックを使って値を取得する場合の、ローレベルディスカバリ（LLD）とアイテムのプロトタイプの設定について

≪ Previous: 4.2のPrometheusからの値取得について

バージョン　2.2.3

監視データ⇒イベントの結果をAPIで取得したいのですが、
どのような記述をすればよいでしょうか。
時間　ホスト　説明　ステータス　深刻度

既存の動くツールに以下があります。（トリガーIDを取得するAPI）
これをどのように修正すればアラート情報を抜けますでしょうか。

----------------------------------------------------------------------------------------------
#!/usr/bin/python
# coding: UTF-8

import json
import urllib2
import sys
import csv

#ZabbixサーバのIPアクセスURL
zabbixsv = "http://X.X.X.X/zabbix/api_jsonrpc.php"

#リクエストヘッダ
headers = {"Content-Type":"application/json-rpc"}

post_data = json.dumps(
{
"jsonrpc": "2.0",
"method": "trigger.get",
"params": {

↧

ESXiから外部チェックを使って値を取得する場合の、ローレベルディスカバリ（LLD）とアイテムのプロトタイプの設定について

September 10, 2019, 8:52 am

≫ Next: rsyncしたログの監視について何か良い方法は無いでしょうか

≪ Previous: zabbixのイベントログのAPIによる取得について

Zabbixが標準で提供しているテンプレートではあまり細かな情報が取得できないため、外部チェック（自身が作成したスクリプト）で値を取得しようと思っています。
対象はESXiと仮想マシンです。

ESXiには値が1つのもの（CPUの個数等）と複数のもの（ESXiがマウントしているデータストア名等）があります。今回お聞きしたいのは、複数のものを取るときの事です。

ローレベルディスカバリを利用しようと思っています。
複数のデータストア名を取得し、json形式で出力するスクリプトを書いたのですが、ローレベルディスカバリとアイテムのプロトタイプはどのように設定すればいいてしょうか？

通常ローレベルディスカバリで複数の値を取得しjson形式に出力した後、アイテムのプロトタイプでそのjsonの値（戻り値）を引数にして何かしらの値をとるようにすると思いますが、スクリプトだけで複数の値が取れてしまうので、ローレベルディスカバリとアイテムのプロトタイプは何を設定すれば良いかわかりません。
教えて下さい。

↧

rsyncしたログの監視について何か良い方法は無いでしょうか

September 10, 2019, 6:37 pm

≫ Next: 既存のSNMPTrap設定をテンプレート化したい

≪ Previous: ESXiから外部チェックを使って値を取得する場合の、ローレベルディスカバリ（LLD）とアイテムのプロトタイプの設定について

他サーバからrsyncしたログを監視したいのですが、常に新しいファイルとして認識してしまい、都度アラートが上がってしまいます。
なにか良い方法をご存じの方はいらっしゃらないでしょうか？

■現状・やりたいこと
1. 対象サーバ(A)（複数）は事情がありzabbix agentを入れられない。このサーバのログを監視したい。
2. Aのログをrsyncで定期的（5分毎）にagentが入っているサーバ(B)に上書きコピーしている（ファイル名は常に同一）
3. Bをzabbix server(C)からキーワードでログ監視（エラー文字のキーワードを監視）
　アイテム： log[/home/user/logs/xxxx.log,@keyword-log,,,skip]
　トリガー：　{log[/home/user/logs/xxxx.log,@keyword-log,,,skip].iregexp(@error-keyword)}=1

■結果
・ログ取得、監視（キーワードによるトリガー）は動いているが、
　監視データ→最新データ→ヒストリを見ると5分おきに同じ行を取得している。
・このため、同じアラートが5分おきにあがってしまう。

■原因（だと思う）
公式ドキュメントにも記述がある↓が原因だと思っています。

↧

既存のSNMPTrap設定をテンプレート化したい

September 11, 2019, 10:30 pm

≫ Next: イベントIDの抽出条件について

≪ Previous: rsyncしたログの監視について何か良い方法は無いでしょうか

Zabbixはバージョン：3.0.7を使用しております。

現在、SNMPTrapの設定を各ホストごとに設定していますが、
今後追加を予定しているネットワーク機器への設定を簡略化するため、
現在設定しているSNMPTrapの設定をテンプレート化したいと考えています。

以下設定を想定しておりますが、トリガーの部分で「名前：」と「条件式：」の
ホスト名の表記方法がわからず悩んでおります。

本設定におけるホスト名の表記法をご教授いただけますでしょうか。
また、もしSNMP Trapの設定で相応しくない箇所などがありましたら、
合わせてご教授いただけますでしょうか。

【アイテム】
　名前：SNMP Trap
　タイプ：SNMP トラップ
　キー：snmptrap[.*]
　ホストインターフェース：IPアドレス:161
　データ型：テキスト
　ヒストリ保存期間(日)：90
　アプリケーション：なし
　有効：チェック入れる

【トリガー】
　名前：（ホスト名）SNMP Trapを検知しました。
　条件式：({ホスト名:snmptrap[.*].iregexp("ホスト名")}=1)and({ホスト名:snmptrap[.*].iregexp("@ホスト名")}=0)
　障害イベントを継続して生成：チェックを入れる

↧

イベントIDの抽出条件について

September 12, 2019, 12:47 am

≫ Next: ログ監視でXX回検知でアラートの方法

≪ Previous: 既存のSNMPTrap設定をテンプレート化したい

下記イベントログ監視のアイテムキーですが、

eventlog[Application,,Error,,11,,skip]

実験的に1128などのイベントログを発生させた場合、
最新データにストックされてしまいました。
11の部分は完全一致ではなく、部分一致なのでしょうか。

↧

ログ監視でXX回検知でアラートの方法

September 12, 2019, 12:56 am

≫ Next: データストアの読取/書込操作で不定期にエラーが発生する件について

≪ Previous: イベントIDの抽出条件について

メールボックスの滞留をログ監視しております。

メールボックスが500以上滞留していた場合、

ログに
メールサーバ名,メールボックスNo,滞留数

が吐かれ、アラート検知します。

アラート検知した場合、下記作業が必要です。
メールサーバへのping
メールボックスのGUIでの確認

上記作業は、基本的に滞留が一時的のため無駄に終わるため、
監視の仕組みを瞬発的にではなく、継続的に滞留していた場合に
アラートを出すに変えたいです。

リソース監視などであれば、count関数などで
XX回継続して、XX超えていたらなどができると思いますが、
同じことをログ監視でもできないでしょうか？

現在はログには滞留数を５００超えた場合に吐かれますが、
監視を実現するために、定期的に図れるようにすることも可能です。

よろしくお願いします。

↧

データストアの読取/書込操作で不定期にエラーが発生する件について

September 17, 2019, 11:14 pm

≫ Next: データストアの読取/書込操作でステータスが「取得不可」になる件について

≪ Previous: ログ監視でXX回検知でアラートの方法

ESXiの監視を行うために、以下のキーの監視項目があります。

vmware.hv.datastore.read[{$URL},{HOST.HOST},datastore1,latency]

その項目の情報欄を確認すると、不定期（１時間に１～２回）の間隔にて、
「Timeout was reached」が表示されます。

zabbix_server.logを確認したところ、
6096:20190918:143132.712 item "ホスト１:vmware.hv.datastore.write[{$URL},{HOST.HOST},datastore1,latency]" became not supported: Performance counter data is not available.
6098:20190918:143133.718 item "ホスト１:vmware.hv.datastore.write[{$URL},{HOST.HOST},datastore1,latency]" became not supported: Performance counter data is not available.
が出力されていました。

しばらく（約１０分ぐらい）すると、以下のログが出力され、zabbixのUI上も

↧

データストアの読取/書込操作でステータスが「取得不可」になる件について

September 17, 2019, 11:25 pm

≫ Next: 現状と違うバージョンのデータをDBにリストアしてしまった場合の対処

≪ Previous: データストアの読取/書込操作で不定期にエラーが発生する件について

ESXiの監視を行うために、以下のキーの監視項目を利用しています。

vmware.hv.datastore.read[{$URL},{HOST.HOST},datastore1,latency]

その項目のステータスは「取得不可」になっており、
情報欄は「Performance counter instance was not found」になっています。

zabbix_server.logを確認したところ、
6095:20190918:144132.940 item "ホスト１:vmware.hv.datastore.write[{$URL},{HOST.HOST},datastore1,latency]" became supported
6098:20190918:144133.940 item "ホスト１:vmware.hv.datastore.write[{$URL},{HOST.HOST},datastore2,latency]" became supported

↧

現状と違うバージョンのデータをDBにリストアしてしまった場合の対処

September 18, 2019, 3:30 am

≫ Next: ログファイルの文字列監視（超基本）

≪ Previous: データストアの読取/書込操作でステータスが「取得不可」になる件について

「Session terminated, re-login, please.」と表示され、管理者権限でのログインができない
http://www.zabbix.jp/node/3327

に書かれている内容と同様と思われるのですが、具体的な対応法としてどのようにするのが適切かご教授いただければと書き込んでおります。

環境　zabbix 3.4.15
DB mariadb 10.1

zabbixのDBのみ破損してしまい、回復を図ったのですがうまく修復できず、バックアップしていたデータからリストアしました。
この時バックアップしていたデータが現状のバージョンの物ではなく、古い物だったため「Session terminated, re-login, please.」と画面に表示される状態となりました。
先に示したスレッドで、バージョンを合わせれば良い、との回答があったのですが、手順としてはどのようにするのがベターでしょうか？
システム側を全体的にリストアしたDBで利用していたバージョンに戻し、そこから再度3.4.15まであげる、と言うのが適切かと思うのですが、もしDB側のバージョンのみあげられるようであれば
そちらの対処が出来ないかと思い、書き込んでおります。

↧

ログファイルの文字列監視（超基本）

September 19, 2019, 10:00 pm

≫ Next: JMX監視が不可

≪ Previous: 現状と違うバージョンのデータをDBにリストアしてしまった場合の対処

zabbixでの監視を始めたばかりの初心者です。
このコミュニティや様々なネットの情報を頼りに設定を進めております。
プロセス数監視やWindowsサービス監視はすんなり出来たのですが、ログファイルの監視をするにあたり
まず、超基本的なログファイル監視を設定したのですが、動作せず、ファイルに文字列を書き込んでも無反応です。

気付いた点があれば教えてもらえると助かります。

行いたいこと：/tmp/test.logファイルに【error】という文字列が書き込まれたらダッシュボードにアラート表示。
環境：サーバーに、zabbix3.0とzabbixエージェントを導入しており、サーバー自身のエージェントを使ってログファイルを監視します。

設定内容
〔アイテム〕
名前：Log File Management
タイプ：zabbixエージェント（アクティブ）
キー：log[/tmp/test.log,error,,,,]
データ型：ログ

〔トリガー〕
名前：test.logログファイルに"error"
条件式：{Zabbix30-CentOS76:log[/tmp/test.log,error,,,,].str(error,#1)}=1
深刻度：重度の障害

〔/etc/zabbix/zabbix_agentd.confの設定（抜粋）〕

↧

JMX監視が不可

September 20, 2019, 12:01 am

≫ Next: Mapのリスト化について

≪ Previous: ログファイルの文字列監視（超基本）

■問題内容
WebSphere Application Server V9.0.0.11のJVM引数にJMX用の設定を入れているのですが、
Zabbixから監視ができておりません。

■環境構成
・WASサーバ
V9.0.0.11
Javaバージョン 1.8.0_211

JVM引数設定値
-Djavax.management.builder.initial=
-Dcom.sun.management.jmxremote
-Dcom.sun.management.jmxremote.authenticate=false
-Dcom.sun.management.jmxremote.ssl=false
-Dcom.sun.management.jmxremote.port=3011
-Dos.encoding=UTF-8
-Dsun.jnu.encoding=UTF-8

OSはRHEL7.3で稼働しており、iptablesにて上記ポートを開放しています。

・Zabbixサーバ
バージョン2.0.4
JMXエージェント設定
上記WASサーバのIPアドレスとJMXポート「3011」を設定

■Zabbix画面のエラー
エージェントの状態が赤くなっており、以下のメッセージが表示されております。

↧