Zabbixで参照系クエリのみ分散は可能でしょうか？

February 28, 2019, 10:05 pm

≪ Previous: ZabbixエージェントおよびZabbixサーバのログファイル名について

Zabbixで利用するDBをレプリケーション設定する事を検討しています。
主な目的は可用性を高める、だったのですが、リバースプロキシなどで参照系クエリだけを複数DBサーバに向けてやれば
複数のグラフなどを開いてもDB負荷は下げられるのでは、と言う問い合わせが社内からありました。
Zabbixの構造上、対応するDBは固定、と言う認識だったため参照系だけ分けるのは無理では無いか、と回答したのですが
調べてみてもレプリケーションの事例はあっても、参照系を分散するような内容を見つけることが出来ませんでした。

参照系だけ振り分けるような事は出来ない、と言う理解で正しいのでしょうか？

↧

Zabbixによる監査目的のログ保管

March 4, 2019, 1:27 am

≫ Next: 「障害」「アクションログ」ページが開かない

≪ Previous: Zabbixで参照系クエリのみ分散は可能でしょうか？

Zabbixではログ監視機能でイベントログなどを収集できますが、
ヒストリ保管期限を長くすることで、例えば過去１年分のログをためて
監査などに利用できるのでは？という検討をしています。

１年分はZabbixのヒストリに溜めて閲覧できるようにし、
期限切れたログはhousekeeper走る前にDBバックアップを
定期的に取得して外部保管。
保管したものが必要となった場合は、開発環境のZabbixへ
リストアして再閲覧可能とさせる、という考えです。

現在ログ管理ツールで各種ログを年間100GBほど収集しています。
このようなログ保管の運用することは可能でしょうか？
その場合の注意点はございますでしょうか？
（ログ参照が遅くなる、DBバックアップやhousekeeperの
　時間がかかる、など）

↧

「障害」「アクションログ」ページが開かない

March 4, 2019, 4:37 pm

≫ Next: Zabbix4.0のHTTPエージェントアイテムのヘッダについて

≪ Previous: Zabbixによる監査目的のログ保管

お世話になっております。
下記環境でZabbixサーバーを構築し運用しております。
OS:CentOS release 6.9
Zabbix:3.2.11

webインターフェースの「監視データ」→「障害」をクリックし障害ページを表示させたいのですが
クリックしても応答待ちのまま何も表示されない状況になっております。
「レポート」→「アクションログ」
「レポート」→「通知レポート」
上記2つのページ表示も同様に応答待ちのまま止まってしまいます。
zabbixサーバーログ、httpdのエラーログを確認しましたが何も表示されない状況です。

このような状況を経験した方はいらっしゃいますでしょうか。
いらっしゃいましたら対応策等ご教示頂けますと幸いです。

↧

Zabbix4.0のHTTPエージェントアイテムのヘッダについて

March 4, 2019, 10:56 pm

≫ Next: 同一のキー設定のLLDを複数設定したい

≪ Previous: 「障害」「アクションログ」ページが開かない

お世話になってます。

Zabbix4.0のHTTPエージェントアイテムでOpenshiftのREST APIを用いて情報取得したいと考えてます。
Zabbixサーバのコンソール上で下記コマンドを実行すると正しく、情報が返ってきます。

↧

同一のキー設定のLLDを複数設定したい

March 5, 2019, 8:42 pm

≫ Next: Web フロントエンドのバグについて

≪ Previous: Zabbix4.0のHTTPエージェントアイテムのヘッダについて

■バージョン
Zabbix：3.4.9

■内容
1つのLLDルール「Mounted filesystem discovery」（vfs.fs.discovery）に対して
フィルター「{#FSTYPE}」と一致する「@File systems for discovery1」には
「vfs.fs.size[{#FSNAME},used]」を設定したい。
フィルター「{#FSNAME}」と一致する「@File systems for discovery2」には
「vfs.dev.write[{#FSNAME},sps]」を設定したい。

上記のように、フィルタごとに設定されるアイテムを分けたいのですが技術的に可能でしょうか。
テンプレートで分けても、同一のキー「Mounted filesystem discovery」（vfs.fs.discovery）の
LLDを「1つのサーバ」に割り当てができなかったので、無理っぽそう。。。とは思っていますが。

====================================
■正規表現の内容
File systems for discovery1

↧

Web フロントエンドのバグについて

March 6, 2019, 4:59 pm

≫ Next: 「Windows Event Log」サービス停止を検知できない

≪ Previous: 同一のキー設定のLLDを複数設定したい

Zabbix の Web フロントエンドを http://hostname/のようにサイト URL がルートになるように設定・運用しています。
具体的には Zabbix の frontend-php パッケージをインストールした /usr/shae/zabbix を Apache の DocumentRoot に直接してしています。
このようにして運用していると、Web インターフェースの一部の機能が正しく動作しません。
少なくとも、メディアタイプの設定が変更できないことと、Zabbix 4.0 の Zabbix server health ダッシュボードのウィジェットが表示されないことがはっきりしています。
この不具合自体は Zabbix 3.2 の頃には存在していたと思います。

Web フロントエンドの URL を http://hostname/zabbixにすればこの不具合は解消するので、frontend-php パッケージのどこかに /zabbix の字句がハードコードされているのではないかと邪推していますが、小生にはそれを検証するだけのスキルがありません。

本現象を検証して本家にフィードバックしていただける篤志の目に留まればと、本フォーラムに投稿いたしました。
詳細情報必要であれば、微力ですが提供いたしますのでよろしくお願いします。

↧

「Windows Event Log」サービス停止を検知できない

March 6, 2019, 6:09 pm

≫ Next: 同じテンプレートを使用しつつ、グループ別にトリガーのServerityを制御する方法はありますか？

≪ Previous: Web フロントエンドのバグについて

下記環境にて「Windows Event Log」サービス停止を検知できません。

●監視対象サーバ
- ZabbixaAgentのバージョン：3.4.6
- WindowsServer2016

●Zabbixサーバ
- Zabbix3.4.9
- RHEL 7.5

●監視設定
アイテム：{<ホスト名>:service.info[EventLog,state].min(#3)}<>0
トリガー：service_state[Windows Event Log]

●試行内容
・監視対象サーバ→「コンピュータの管理」→「サービス」において、「Windows Event Log」を停止後、5分待ったが検知できず

・監視対象サーバ上で下記コマンドを試したが0=動作中
> <パス>\zabbix_agentd.exe -t service.info[EventLog]
> service.info[EventLog] [u|0]

・Zabbixサーバ側で下記コマンドにて確認したが、動作中となっている
> zabbix_get -s <ホストのIP> -k service.info[EventLog]
> 0

・別のサービスで停止を試したところ検知可能

↧

同じテンプレートを使用しつつ、グループ別にトリガーのServerityを制御する方法はありますか？

March 6, 2019, 8:46 pm

≫ Next: Web監視の認証ステップでリダイレクトループ

≪ Previous: 「Windows Event Log」サービス停止を検知できない

# やりたい事
テンプレートは分割せずに、グループ単位でServerityを制御したい。
例えば、特定グループの特定トリガーのServerityだけInformationにするといった上書き（オーバライド）

# 経緯
ネットワーク機器の監視をしており、Linkdownの通知をSlackへ行なっていますが、コアSWの通知は行いたい一方、エッジSWの通知は行いたくありません（PCの電源OFFなどで日常的に発生するため）

テンプレートをコアSW用と、エッジSW用に分割する事で回避する、あるいはアクションでの条件設定で頑張れる気はするのですが、”特定グループの特定トリガーのServerityだけInformationにするといった上書き（オーバライド）”が出来れば管理としてもシンプルになる気がしていますが、可能でしょうか？

また、他に良い方法があれば大歓迎です。

# 環境
Zabbix 4.0.0-2
CentOS 7.2.1511

関し対象は主にCiscoSW
使用テンプレートはTemplate Net Cisco IOS SNMPv2

↧

Web監視の認証ステップでリダイレクトループ

March 7, 2019, 8:04 pm

≫ Next: zabbixのjson pathについて

≪ Previous: 同じテンプレートを使用しつつ、グループ別にトリガーのServerityを制御する方法はありますか？

いつもお世話になっております。

zabbix: 3.0.7
curl: 7.29.0-51
CentOS 7.3

Web監視で以前までできたログイン認証のステップがリダイレクトループ(Number of redirects hit maximum amount: Maximum (10) redirects followed)となりできなくなってしまいました。
Webサイトの構成が変わった可能性を疑いお客様にも聞いてみますが、このような状況におちいる原因は一般的にどのようなことが考えられるでしょうか。

※手動でブラウザログインは正常にできURLやPOSTパラメータも特に変わっていないように見えます。
※通常リダイレクトは1回のみのようです。

【参考】
・ステップ１：TOP Page
URL：https://hoge.com/hoge/Login.xhtml
変数：{csrf}=regex:value="([0-9a-z]{8}\-[0-9a-z]{4}\-[0-9a-z]{4}\-[0-9a-z]{4}\-[0-9a-z]{12})"
要求文字列：LOGIN
ステータスコード：200

・ステップ２：Login
URL：https://hoge.com/hoge/login

↧

zabbixのjson pathについて

March 7, 2019, 8:08 pm

≫ Next: テンプレートを分けずに閾値の異なるトリガーを設定したい場合

≪ Previous: Web監視の認証ステップでリダイレクトループ

zabbixのHTTPエージェントでjsonを取得し、json pathを使用してパースしようと考えています。
[0]のサンプルjsonコードを$.store.book[*].priceで複数のpriceをパースしたいのですが、
*（アスタリスク）がzabbixの仕様上サポートされていないように見受けられます。

[*]の代替となる方法があれば教えてください。

[0]JSONPathにおける[*]と..の違い
https://qiita.com/zaki_taka4/items/246b91bc569a41a1497d

↧

テンプレートを分けずに閾値の異なるトリガーを設定したい場合

March 10, 2019, 6:26 pm

≫ Next: 外部チェックを利用して取得したパラメータにトリガーを設定したい場合

≪ Previous: zabbixのjson pathについて

■バージョン
Zabbix：3.4.9

■内容
下記でも同様な質問が出ていましたが、ホストAとBで閾値の異なるトリガーを設定したい場合
それ以外のアイテムキーやトリガー設定がすべて同じだとしても、
テンプレートを分けないといけない、ということでしょうか。

同じテンプレートを使用しつつ、グループ別にトリガーのServerityを制御する方法はありますか？
http://www.zabbix.jp/node/4633

====================================
●テンプレート
system.cpu.util[,idle]※ここだけホストAとBで閾値を変えたい
system.cpu.load[percpu,avg1]
vm.memory.size[used]
system.swap.size[,used]
system.uptime
etc...

■理想
ホストA
・下記は設定される
{Template OS Linux:system.cpu.util[,idle].avg(600)}<70

・下記は設定されない
{Template OS Linux:system.cpu.util[,idle].avg(600)}<50

ホストB
・下記は設定される

↧

外部チェックを利用して取得したパラメータにトリガーを設定したい場合

March 10, 2019, 10:10 pm

≫ Next: アイテム：ポーリング落ちが発生した場合の処理について

≪ Previous: テンプレートを分けずに閾値の異なるトリガーを設定したい場合

○バージョン　3.4.6

お世話になります。
外部チェックを利用して、AWSのCloudWatchからBurstBalanceなどを取得し、
自動でトリガーを設定したいと考えております。

スケールアウトする際は、zabbixエージェントが自動で起動して情報を投げるため
トリガーを設定するタイミングでアイテムが既に存在しており、トリガー設定可能なのですが、
エージェントからの情報を元に別途外部チェックで取得しているデータ（例えばBurstBalance）
に対しては、アイテムがどのタイミングで生成されるか不明で、どの様にトリガーを設定したら
良いかがよくわかりません。バッチ処理などで、定期的に状態をチェックしてトリガーを
設定するしかないのでしょうか。

対応方法、考え方などご教示頂けないでしょうか。
よろしくお願いいたします。

↧

アイテム：ポーリング落ちが発生した場合の処理について

March 11, 2019, 8:42 pm

≫ Next: 障害と復旧を同じタイミングで検出

≪ Previous: 外部チェックを利用して取得したパラメータにトリガーを設定したい場合

NW上で障害があり、ポーリング落ちが発生した場合の処理について教えてください。
まず、アイテムの設定は下記のとおりとします。
　データ型　　：数値(整数)
　取得間隔　　：60秒
　保存時の計算：差分/時間

次に、下記のように0:01にポーリング落ちが発生したと仮定します。

タイムスタンプ　　| OIDで取得した生値
2019/1/1　0:00　| 100
2019/1/1　0:01　|（ポーリング落ち）
2019/1/1　0:02　| 150

この場合、ヒストリに保存される値として、“データの差分”については
0:01に保存される値が「処理なし」となるため、0:02では150-100＝50となると思います。

【source】（ちょっと古いですが）Zabbix Documentation 2.2
https://www.zabbix.com/documentation/2.2/jp/manual/config/items/item
[パラメータ：保存時の計算]の注釈より
“現在の値が前の値より小さい場合、その差は破棄され（何も保存されません）、別の値を待ちます。”
⇒Zabbix上で[最新データ]から値を見ると、ポーリング落ちのタイムスタンプ・値は表示されていませんので、

↧

障害と復旧を同じタイミングで検出

March 13, 2019, 4:25 am

≫ Next: 指定文字列の数をトリガー条件にする

≪ Previous: アイテム：ポーリング落ちが発生した場合の処理について

お世話になります。
下記現象について、もしどなたか追加の確認項目があれば、教えて頂けないでしょうか

●監視対象サーバ
- ZabbixaAgentのバージョン：3.4.6
- WindowsServer2016
- AWS

●Zabbixサーバ
- Zabbix3.4.9
- RHEL 7.5
- AWS 対象サーバと同じサブネット

●問題
テンプレートの通り、下記トリガーを設定し「Zabbixエージェントに接続できない状態が5分続いた状態」を検出しようとしております。
{<ホスト>:agent.ping.nodata(5m)}=1

ただ実際に試したところ、週2,3レベルで検出の1分後に復旧メールが飛んでおります。
例：
コンソールでの「時間」　内容　アラートメールに記載した {EVENT.TIME}
21:38:00 　警告　 21:38:00
21:39:59 　復旧　21:38:00 ←復旧時実行内容で指定する {EVENT.TIME}とは、復旧ではなく検出のタイミングを指す？

Zabbixのログを見てみると、該当時間にも下記出力がありましたが、”failed~”はこの時間帯に限らず毎日毎時間発生しているようです。

↧

指定文字列の数をトリガー条件にする

March 14, 2019, 3:45 am

≫ Next: トリガー関数 logseverityを利用したトリガー式が動作しない

≪ Previous: 障害と復旧を同じタイミングで検出

初歩的な質問ですが、どなたかご教示ください。

●監視対象サーバ
- CentOS 7

●Zabbixサーバ
- Zabbix3.0.23
- CentOS 7.6

●問題
スクリプト結果に"OK"が5つ含まれない　　←つまり"OK"数が4つでも、6つでのアラート対象
もしくは、NG or WARNが含まれる

でアラート対象にしたいのですが、
うまく動きません。

↓下記指定で何か問題ありますでしょうか。

・アイテム
タイプ：SSHエージェント
キー：ssh.run[test]
実行するスクリプト：cat /tmp/test.txt
データ型：テキスト

・トリガー
条件式
{xxxx:ssh.run[test].regexp("OK",#5)}=0 or {xxxx:ssh.run[test].iregexp(NG|WARN)}=1

↧

トリガー関数 logseverityを利用したトリガー式が動作しない

March 14, 2019, 6:58 pm

≫ Next: Zabbix4.0とZabbix2.0での検知結果の差異について

≪ Previous: 指定文字列の数をトリガー条件にする

いつもお世話になっております。
以下についてご教授頂きたく宜しくお願い致します。
---------------------
Ver:Zabbix 4.0.4
OS:CentOS 7.1
---------------------

■設定内容
以下のアイテム式とトリガーを設定しております。

→アイテム
eventlog[System,@TEST,Error|Critical]
※正規表現"TEST"は .*　[結果が真」です。
　将来的にフィルターをしたいので入れてあります。

→トリガー
({TESTHOST:eventlog[System,@TEST,Error|Critical].logseverity(0)}>3) and ({TESTHOST:eventlog[System,@TEST,Error|Critical].nodata(30)}=0)
※トリガーの設定は"単一"で、現行のトリガーステータスは"正常"です。

■質問内容
設定内容の監視を導入しておりますが、
アイテムとして値を拾うので問題無いのですが、トリガーが動作しない状況です。
マニュアルや、過去フォーラムを確認しましたがどうにもわかりません。

↧

Zabbix4.0とZabbix2.0での検知結果の差異について

March 17, 2019, 7:21 pm

≫ Next: LLDで取得した複数のCPU使用率を計算式を使って平均値を出したい

≪ Previous: トリガー関数 logseverityを利用したトリガー式が動作しない

お世話になっております。
現在、Zabbix2.0より、Zabbix4.0へのバージョンアップを計画しており、2バージョンを並行運用してテストしております。
現行サービス機はZabbix2.0です。

Zabbix4.0へZabbix2.0で使用しているDBをリストアしてテストしています。
Zabbix4.0とZabbix2.0でログ監視の検知結果に差異が発生したため、原因と対処についてご教授いただけないでしょうか。

環境は以下になります。
Zabbix2サーバ：
OS　rhel 5.8
ZabbixVer　2.0.3
DB　Postgresql9.2.0

Zabbix4サーバ：
OS　rhel 7.3
ZabbixVer　4.0.7
DB　Postgresql9.2.18

差異の発生したアイテム・トリガー設定：
アイテム：
名前　log file($1)
タイプ　Zabbixエージェント(アクティブ)
キー　log[(ログファイル),"@正規表現",SHIFT_JIS,,]
データ型　ログ

トリガー：
名前　[Log_AP][(ログファイル)]{ITEM.VALUE}
深刻度　重度の障害

↧

LLDで取得した複数のCPU使用率を計算式を使って平均値を出したい

March 18, 2019, 1:05 am

≫ Next: Zabbix画面のログイン失敗について

≪ Previous: Zabbix4.0とZabbix2.0での検知結果の差異について

お世話になっております。

現在LLDでLinuxサーバーのCPU使用率をSNMPポーリング監視によって
取得しているのですが、アイテムのプロトタイプで計算を使用して平均値を
割り出したいのですがどのように計算式を記述すればよいかがわからないので
ご参考になる計算式等をご教示いただけますと幸いです。

◆環境
zabbix4.0.5

◆対象
CentOS7

使用しているアイテムのプロトタイプ
　　　　名前：　CPUCore: {#IFNAME}　
　　　　タイプ：　SNMPエージェントv2
　　　　キー：　.1.3.6.1.2.1.25.3.3.1.2.[{#SNMPINDEX}]
SNMP OID：　.1.3.6.1.2.1.25.3.3.1.2.[{#SNMPINDEX}]

snmpwalkコマンドでのCPUの表示数としては32個あります。

以上、よろしくお願いいたします。

↧

Zabbix画面のログイン失敗について

March 18, 2019, 5:37 am

≫ Next: 監視間隔の変更

≪ Previous: LLDで取得した複数のCPU使用率を計算式を使って平均値を出したい

現在、zabbixの4.0.3を使用しております。
GUI画面にログインするため、デフォルトのユーザ名とパスワードでログインを試みたところ、
ログイン画面の『Username』の下部に下記のメッセージが表示され、ログインできませんでした。
こちらについては、セッションIDの作成ができなかった際のエラーのように見受けられますが、このようなケースは今までございましたでしょうか。
また、考えられる原因等があればご教示頂ければと思います。

SQL statement execution has failed "INSERT INTO sessions (sessionid,userid,lastaccess,status) VALUES ('dab83f8246e38fd0f0b8949c9707b01c','1','1552912232','0')".

↧

監視間隔の変更

March 19, 2019, 3:29 am

≫ Next: ログ監視にて同じメッセージを検知し続ける件

≪ Previous: Zabbix画面のログイン失敗について

Zabbixの初心者です。よろしくおねがいします。

どうにか、Zabbixサーバ構築が終わり、数台のwindowsやlinuxにagentも入れて、
サーバ側で自動検出でいろいろとれる様になったのですが、監視間隔の初期値1mの
変更方法がわかりません。
監視間隔の1mの場所は、わかるのですが、WEB上は、ロックされていて変更が
できません。
　これは、どういう手順でやれば、変更できるのでしょうか？
お分かりの方がいたら、教えてください。よろしくお願いします

↧