今回新規でVM上にZABBIXマネージャを構築することになりました。
200台程度のサーバ、ネットワーク機器を監視する想定です。
この場合のCPUサイズ(コア数)を見積もる必要があるのですが、どなたか考え方含め
ご教示頂けないでしょうか。よろしくお願いします。
zabbixマネージャのスペックについて
Windowsで日本語のログを監視する方法
windowsserver2016でzabbix3.4を使っていて、
zabbixserverはRHEL7に入れています。
イベントログではなくエクスプローラー内に作ったログファイルを監視しています
log[C:\xxx\xxx\xxx.log,”エラー”]というアイテムキーを作りましたが、
ステータスは有効でエラーも無いのに値が取れません。
バックアップ/データベース/完了できませんでした/エラー [いずれかの文字列が含まれる]
正規表現に変えてみても値が取れません。
agentd.confのサーバ名やホスト名のところは合っていて、変更したあとの再起動もしています。
log[C:\xxx\xxx\xxx.log,”Error”]のように、英語で検知しているファイルはアイテム有効でトリガーも動き、
ユーザ権限を見比べても違いはありませんでした。
どなたか教えていただけないでしょうか。
よろしくお願いします。
ネットワーク機器でのsnmptrap
現在ZABBIXを監視で使用させてもらっております、okiです。
L2スイッチでtrap発生時にスイッチポートの何番目から発生したのは
判明します。その先のスイッチポートから接続先のサーバのサーバ名など
表示できる方法はあるでしょうか?
監視エージェントはL2スイッチです。
以上、よろしくお願いいたします。
ネットワーク機器でのsnmptrap
現在ZABBIXを監視で使用させてもらっております、okiです。
L2スイッチでtrap発生時にスイッチポートの何番目から発生したのは
判明します。その先のスイッチポートから接続先のサーバのサーバ名など
表示できる方法はあるでしょうか?
監視エージェントはL2スイッチです。
以上、よろしくお願いいたします。
特定メッセージが制御できない
はじめまして。Zabbix利用が浅いためお知恵を貸して頂けないでしょうか?
対象バージョン:Zabbix3.0
対象OS:Linux
監視対象:WindowsServer2012R2
上記の構成で、2台のZabbixを構築している環境となります。
監視対象のサーバにて出力されたイベントビューワのログをZabbixにて表示しております。
質問事項:
2台のZabbix(A、Bと呼ぶ)に対し、同じホストを対象に同じ設定を入れているのに関わらず、
処理結果が異なる場合の原因究明方法についてご教授ください。
事象:
A、Bそれぞれで正規表現を利用し、監視対象サーバのイベントID:51をZabbix上に
表示させない(無視する)ように設定をしております。
しかし、Aは期待通りの動作をしているが、BではZabbix上に表示されてしまっております。
設定構成:
Template XXX(仮称) に Win2012R2のホストを所属させている。
アイテムについては、Templateに設定
eventlog[System,,\Warning\]
トリガーは、ホストに対し設定
Windows ログ監視によるCPU高負荷について
Ver:Zabbix 3.0.10 および 3.0.22
OS:Windows7 32bit
お世話になります。
タイトルの件、ご教授頂きたく宜しくお願い致します。
社内でzabbixによる監視を検討しており、いろいろと試しているのですが
上記エージェント環境のログを監視を試してみたところ、CPU高負荷になります。
具体的にいうと下記監視対象ログからエラー対象の4行目のログ1行を抽出するのに
zabbix_agents.exe が使える分だけCPUを使用して使用率100%が10分程継続します。
尚、抽出は問題なくおこなえております。
DebugLevel=4 にてログを確認したところ、1行目と3行目のログを確認してる際に
下記ログがひたすら出力されていました。
2824:20181015:102929.199 In collect_perfstat()
2824:20181015:102929.217 End of collect_perfstat()
2824:20181015:102930.245 In collect_perfstat()
2824:20181015:102930.261 End of collect_perfstat()
なにか解決策はございますでしょうか。
<正規表現>
テンプレート内のアイテムを他のアイテムにコピーしたがアイテム一覧に表示されない
お世話になっております。
標題の件、解決できず困っております。
zabbix server 3.0.22
■実施した事
NW機器のNWインターフェース監視用のテンプレートAを作成し、
ポートチャンネル#1と#2のステータスを監視するアイテムを作成しました。
上記テンプレートをホストxxxに紐付けました。
ホストyyyも同様にポートチャンネル#1と#2を持っているため(index番号が異なる)、
テンプレートBを作成し、ポートチャンネル#1と#2のステータスを監視するアイテム
をテンプレートBのアイテムにコピーし、コピーできることを確認しました。
■発生した事象
index番号のみ変更するため、テンプレートBを確認したところ、ポートチャンネル#2の
アイテムはありましたが、ポートチャンネル#1のアイテムが一覧にありませんでした。
再度、テンプレートAからポートチャンネル#1用のアイテムをテンプレートBのアイテムにコピー
したところ、「テンプレートBのアイテム"Iアイテム名", アイテム"アイテムキー"はホストyyyにすでに存在します(他のテンプレートからの継承)」
とエラーが出てコピーできません。
コピーしたポートチャンネル#2のアイテムを複製しても上記のエラーとなりました。
SNMP経由でのNWトラフィックの閾値監視について
お世話になります。
標題について、当フォーラムを検索してみましたが、
事象に当てはまるものがなく質問させていただきます。
Zabbix server 3.0.22
■要件
TenGigabit etherのインターフェース(IN/OUT両方)が8Gbpsを5分以上継続したら
アラート
下記の通りSNMP経由でのNWトラフィックの閾値監視用トリガー設定したところ、8Gbpsを超えていないにも
関わらずをアラートを検知してしまい、想定通りになっておりません。
構文が正しいかご意見いただければ幸いです。
下記アイテムで想定通りの値が取れていることを確認
■アイテム
アイテム名:NW Traffic In Te1/0/1
タイプ:SNMPv2エージェント
キー:nw_traffic_in_te1_0_1
oid:"oid"
コミュニティ名:”コミュニティ名”
データ型:数値(浮動少数)
単位:bps
保存時の計算:差分
■トリガー
条件式:{ホストA:NW Traffic In Te1/0/1.last(0,300)}>8G
お手数をお掛けして申し訳ございませんが、よろしくお願い致します。
Zabbix 4 でのアクションに関して
フォーラムにはいつもお世話になっております。
Zabbix 3.0.5で稼働している環境を 4.0.0に移行するための検証を行っています。
Zabbix 4.0.0 にDBが更新されたときのログに、下記が記載されました。
Action "ZABBIXサーバー稼働" condition "Trigger value = OK" will be removed during database upgrade: this type of condition is not supported anymore
アクションで設定を確認したところ、トリガーの値という条件が無くなり、設定ができなくなっていました。
Zabbixサーバが稼働していることを確認するメールを送信するため、下記のトリガーを設定し、アクションでトリガーの値が正常な時に、メールを30分に一回送信する設定をしていました。
{Zabbix Server:proc.num[zabbix_server].last(0)}<1
and {Zabbix Server:proc.num[zabbix_server].nodata(120)}=0
アクションでトリガー状態という条件が無くなり、障害時は実行内容タブの設定が実行され、復旧時は復旧時の実行内容タブの内容が実行されるようになったようです。
web監視 web.test.timeを使ったトリガー
お世話になっております。
zabbix3.4
サーバもエージェントもRHEL7に居ます。
二点あります。
ひとつめ
30秒間レスポンスがなければタイムアウトと見なして障害とする
みたいなトリガーを設定したいです。
{ホスト名:web.test.time[シナリオ名,ステップ名,resp].last()}>30
{ホスト名:web.test.time[シナリオ名,ステップ名,resp].count(#30,0,"gt")}>0
上記二つ試してみましたが動かないので
どこがおかしいのか教えていただきたいです。
認証は今は設定していないですが、これからベーシック認証になるかもしれないです。
ふたつめ
web.test.timeとweb.test.failを使って監視をしていますが
この二つの使い分けがいまいちピンときません。
何か決定的な違いがあれば教えていただけないでしょうか。
よろしくおねがいします。
ping監視のキューがたまってしまう現象
お世話になっております。
今回、ping監視のキューがたまってしまい解決策を模索しているのですが
中々解決に至らないので投稿させていただきます。
~環境~
CentOS 7.3
MariaDB 5.5
Zabbix 3.4
監視ping監視しているホスト数は40台で全体の有効アイテム数は953
一秒当たりの監視項目数は11.94です。
ping監視のキューがたまっている事象の記事を見てzabbix_server.confの
StartPingerの値やStartPollerなどの設定を変更し、再起動しても改善が
見られていません。以下にアイテムとserver.confの設定値を記載します。
~ping監視~
icmpping[,3,300000,68,3000]
~zabbix_server.conf~
StartPollers=10
StartPingers=30
CacheSize=32M
CacheUpdateFrequency=120
StartDBSyncers=8
zabbix_server.confについては自身と同様な現象の解決した際の記事を
参考に設定を変更してみました。
※追記
Template App Zabbix Serverのテンプレートは適用して
ZABBIXの画面上にSNMPトラップのメッセージが出力されない件について
お世話になっております。
標題の件、過去のフォーラム等を参考にSNMP Trap設定を
行いましたが、/varlog/messagesと/var/log/snmptt.logへのtrap出力は確認できましたが、
zabbix webUI上でtrap内容が出力されず、有識者の方のアドバイスをいただければと思います。
zabbix server 3.0.22
以下のフォーラムとリンクを参照し、SNMP Trapを設定しました。
■過去フォーラム
ZABBIXの画面上にSNMPトラップのメッセージが表示されない
SNMP Trapの受信について
また、以下を参照にmibがコンバートできる事を確認しています。
※参考URL同様にIF-MIBをコンバートし所定のディレクトリに配置しました。
https://www.slideshare.net/qryuu/zabbix20snm-ptt
下記の通りアイテムを登録しました。
アイテム名:Trap TEST
キー:snmptrap[regexp]
タイプ:SNMPトラップ
データ型:ログ
ログの表示形式:hh.mm.ss yyyy/MM/dd
※snmptt.confの設定内容と合わせています。
※また、ホストsnmpiインターフェースの設定も行っています。
ログ監視の復旧通知メールの出力内容について
Ver:Zabbix Server 3.4.13
OS:Alpine Linux v3.4.6
お世話になります。
タイトルの件、ご教授頂きたく宜しくお願い致します。
■検出したエラーメッセージ
エラーメッセージA
エラーメッセージB
ログ監視において、トリガーの障害イベント生成モードを「複数」に設定して
一度に複数のエラーレコードを検出した場合、1レコード毎にアクション
(障害メール通知)を実行するようにしております。
またアクションの実行内容:デフォルトのメッセージでは下記のように設定して
各アクション(障害メール通知)にて別々のエラーメッセージを出力するように
しております。
■実行内容のデフォルトのメッセージ設定
-------------------------------------
発生日時: {EVENT.DATE} {EVENT.TIME}
トリガー名: {TRIGGER.NAME}
ホスト名: {HOST.NAME}({INVENTORY.NAME})
重大度: {TRIGGER.SEVERITY}
メッセージ:エラーレコードを検出しました。
検出したレコード:{HOSTNAME}:{ITEM.VALUE}
-------------------------------------
web監視でのアラートについて
お世話になっております。
Web監視(Webシナリオ)のアイテム及びトリガーについて質問させていただきます。
アイテムにHTTPステータス値を取得する設定をして
HTTPステータス200、401、403以外でアラート出力させる
トリガー設定をすることは可能でしょうか?
ありましたらご教示お願い致します。
※zabbixサーバ側でコマンド「curl -L -s -o /dev/null -w "%{http_code}\n" {URL}」を
実行するとステータスコードが取得できたので外部スクリプトで取得する方法も
視野に入れております。
zabbixサーバのバージョン
3.4.4
Windowsで作ったファイルをCentOSで監視できない
CentOS、Samba上にtextファイルを出力しCentOS上で動作しているZabbix-agentで監視したい
【Centosバージョン】
7.5.1804(Core)
【Zabbix-agent】
3.4.14
【アイテムの設定】
タイプ:Zabbixエージェント(アクティブ)
キー:logrt[/Samba/ExeCute.txt]
データ型:ログ
更新間隔:5s
windowsで出力しているファイルは、1行です。
エンコード:UTF-8
CentOS上でファイルをテキストエディタで開いて保存するとデータが取れます。
CentOS上で保存したファイルは、Windowsで開けなくなります。
よろしくお願いいたします。
複数の単一サーバの特定プロセスをトリガー条件式に定義する方法
■環境
●ZabbixServer 3.0.21
・OS:RHEL7.4
・DB:mariadb5.6
●ZabbixAgent 3.0.21
・OS:RHEL7.4
■実施したい監視内容
Aサーバ、Bサーバにて起動してるaaaプロセス(同様プロセス)をAサーバ、Bサーバにて個別停止した場合、トリガーAorB
Aサーバ、Bサーバ両方停止している場合、トリガーAandBとしたい。
■想定テンプレート
テンプレート名:ABテンプレート
アイテムキー:proc.num[aaaa,,,^aaa.conf$] (カンマの数は適当です。用はプロセス名とコマンドラインを監視)
トリガー名:トリガーAorB
トリガ条件式:{ABテンプレート:proc.num[aaaa,,,^aaa.conf$].last()}=0
トリガー名:トリガーAandB
トリガ条件式:({Aサーバ:proc.num[aaaa,,,^aaa.conf$].last()}=0) and ({Bサーバ:proc.num[aaaa,,,^aaa.conf$].last()}=0)
■質問内容
Trap監視とMIBファイルについて
とあるルータ、NECのUNIVERGE IXルータをZabbixで監視をしてもらうことになりましたが、依頼するのは初めてなので、仕組みについて教えてください。
CPUの使用率などのポーリング監視についてはMIBのOIDを指定するといいます。サポートするMIBとそのOIDを調べて指定します。それはできそうです。
電源が電圧、機器shutdownの故障などでTrap監視したいのですが、その際、MIBファイルを指定するという話を聞いています。例えば、今回はとあるルータとはNECのUNIVERGE IXルータなのでマニュアルからプライベートMIBは"PICO-SMI-MIB"というMIBファイルがありました。このMIBファイルを提供すれば終わりなのでしょうか?このMIBの中には電源や電圧などからさまざまなMIBを網羅しているようなのですが、どうやってその中から電源が電圧だけを監視することになるのでしょうか?どうぞよろしくお願いします。
エラー1053:そのサービスは指定時間内に開始要求または開始制御に応答しませんでした。
お世話になっております。
現在以下構成にてサーバ監視を行っております。
zabbix-server
OS:centos7.5
zabbix:zabbix4.0.0
DB:MariaDB, for Linux (x86_64) using readline 5.1
監視対象サーバ
windows server 2012R2 (zabbix-agent)
zabbix-agentの入手方法については windows server2012にてzabbix社の公式ページより以下内容で取得しました。
Version:4.4.0
OS:windows
Hardware:amd64(windows serverと同様に64bitに合わせました。)
Encryption:なし
上記内容でWindows server2012R2にzabbix-agentを導入し、サービスを起動しようとしたタイミングでタイトルにございます。
「エラー1053:そのサービスは指定時間内に開始要求または開始制御に応答しませんでした。」が発生いたしました。
下記サイト等も参考に設定値を変更しましたが、状況は改善いたしませんでした。
メール通知について
Ver:Zabbix3.4.12
サーバOS:CentOS7.3
zabbixで以下のメール通知の設定をしたいのですが設定方法をご教授いただけないでしょうか。
・Zabbixサーバ自身の監視で定期的に(1日に一回)zabbixサーバが正常に動作しているかをメールで通知を受けたい。
・監視対象のサーバ、スイッチの障害時だけでなく復旧時にもメールで通知を受け取りたい
現状の設定値
管理→メディアタイプ→メディアタイプの作成→名前:任意、タイプ:メール、SMTPサーバ:任意のIP、SMTPサーバポート番号:25、SMTPhelo:ドメイン名、送信元メールアドレス:任意、接続セキュリティ:なし、認証:なし→追加
管理→ユーザ→Admin→メディア→追加→タイプ:上記で作成したメディアタイプ、送信先:任意、指定した深刻度の時に使用:すべて選択→追加→更新
*これで障害時のメールを受信することができています。
Zabbix4.0 HTTPエージェントについて
Zabbix 4.0.0
CentOS 7.2
MySQL 8.0.12
いつもお世話になっております。
今まではスクリプトで対応しておりましたAPI関連の監視ですが、
HTTPエージェントで代替可能かを模索しております。
単発のリクエスト/レスポンスによる監視が可能なタイプであればよいのですが、
ZABBIXのAPIのように、まず認証してTOKENを払い出し、以降のリクエストにそのTOKENを指定するというタイプの場合、
アイテムの取得は可能なのでしょうか?
以下のようなアイテムでTOKENだけを抜き出すことは可能ですが、このアイテムの値を利用して次のリクエストを
投げる(例:host.get)というのは可能でしょうか?
アイテムキー:api.token
URL:https://127.0.0.1/zabbix/api_jsonrpc.php
メソッド:GET
リクエストボディのタイプ:{"auth":null, "method":"user.login", "id":1, "params":{"user":"Admin", "password":"zabbix"}, "jsonrpc":"2.0"} ※JSON
ヘッダー:Content-Type → application/json-rpc