仮想アプライアンスサーバの監視について

August 3, 2018, 6:47 pm

≫ Next: ノードマップからのターミナル起動、ログインができるでしょうか

≪ Previous: トリガー条件式のnodata関数の動作について(ログ監視)

こんにちは。最近仮想アプライアンスサーバが広まってきていますが、
ちょっと調べた感じだとZabbixで仮想アプライアンスサーバは監視できないのでしょうか。

もし仮想アプライアンスサーバの監視について知見を持っている方がいればご教授いただきたいです。

↧

ノードマップからのターミナル起動、ログインができるでしょうか

August 5, 2018, 9:42 pm

≫ Next: アクション実行について

≪ Previous: 仮想アプライアンスサーバの監視について

いつも参考にさせていただいております。

ノードマップのアイコンをクリックすると、
該当ノードにsshでログインできるようなことが実現できるでしょうか？
https://www.zabbix.com/documentation/3.4/manual/web_interface/frontend_s...

以下は実現案の一つです。
Windowsクライアントでマップを表示し、障害が発生したノードがハイライト表示されて、
クリックするとTeraTermマクロが起動して、ユーザ名とパスワード、IPアドレスを
引数で渡すと、そのノードにログインできる、といったようなことができると理想だと思っています。
もしくは、ユーザ名と秘密鍵を引数に渡してログインするなど。

その他に実現可能な案があればご教示いただきたく。

どうぞ、よろしくお願いいたします。

↧

アクション実行について

August 5, 2018, 10:57 pm

≫ Next: コマンドでのping、fpingは問題ないが、一部のルータのみZabbixからicmpping監視ができない

≪ Previous: ノードマップからのターミナル起動、ログインができるでしょうか

いつもお世話になっております。
アクション実行について質問させてください。

アクション（メール通知）が遅延する事象が発生しており、対応に苦慮しております。
対策としては、現在のバージョン（3.0）を3.4へのバージョンアップし、
alerter processesが多重で起動できるよう設定を行うことだと考えておりますが
以下の相談内容にご助言いただけると助かります。

■環境
　CPU：Xeon プロセッサー E3-1220v6(3GHz/4コア/8MB)×1
　メモリ：8GB(8GB 2400 UDIMM×1)
　ディスク：300GB
　ZabbixVersion：Zabbix-Server 3.0

■事象
　・アクション（メール通知）が一時間に100件程度実行される環境において、
　　alerter processesが100％となり、アクション（メール通知）が遅延する事象が発生しております。

■相談内容

　・CPU、メモリ等のリソースは落ち着いており、alerter processesのみ100％となる状況です。
　　そのため、サーバ性能にかかわるものではないと仮定しておりますが一般的に
　　「アクション（メール通知）が継続的に一時間に100件程度実行される環境」の場合、

↧

コマンドでのping、fpingは問題ないが、一部のルータのみZabbixからicmpping監視ができない

August 5, 2018, 11:04 pm

≫ Next: agent自動登録でのSNMPインターフェース追加について

≪ Previous: アクション実行について

CentOSにZabbixをインストールしたサーバー1台の構成で、
10台程度のルータをPingで監視したいと考えています。
9台のルータは問題なく監視ができていますが、
1台のルータだけコマンドでのping、fpingは応答がありますが、
Zabbixのicmppingで監視すると、「0(Down)」の状態になります。

テンプレート「Template Module ICMP Ping」を適用しても、
「ICMP loss」は「100%」、「ICMP response time」は「0」となります。

何か確認すべき点などはありますでしょうか。

・ping、fpingの結果は次の通りです。
# ping xx.xx.xx.xx
PING xx.xx.xx.xx (xx.xx.xx.xx) 56(84) bytes of data.
64 bytes from yy.yy.yy.yy: icmp_seq=1 ttl=252 time=8.42 ms
64 bytes from yy.yy.yy.yy: icmp_seq=2 ttl=252 time=8.45 ms

# fping xx.xx.xx.xx
xx.xx.xx.xx is alive [<- yy.yy.yy.yy]

↧

agent自動登録でのSNMPインターフェース追加について

August 6, 2018, 12:03 am

≫ Next: ホストが無効になる時の条件

≪ Previous: コマンドでのping、fpingは問題ないが、一部のルータのみZabbixからicmpping監視ができない

お世話になっております。

agent自動登録機能を利用して、ホストをWebUIに反映するとき、HostnameItem=system.hostname　の設定をしました。
ここでSNMPインターフェースが反映されないので、action機能のRemote Commandを利用してshell script を実行して登録するよう設定しました。
しかし、いざ実行すると、以下のエラーが出てしまいます。

１．cannot link template(s) "xxxxxxxxxxxxx" to host "host123": cannot find "SNMP" host interface
２．cannot send list of active checks to "xx.yy.0.zz": host [host123] not found

と出てしまいます。
上記の解決策をネットで調べましたが適切なものが見当たりません。
そこで上記の解決策について、ご教示いただけますでしょうか。

【バージョン】
◆zabbix_server：3.4.11

【参考サイト】
http://u0sa0.hateblo.jp/entry/2013/11/03/020058
http://www.zabbix.jp/node/2477

↧

ホストが無効になる時の条件

August 6, 2018, 7:29 pm

≫ Next: アイテムキー「system.run」の使い方について

≪ Previous: agent自動登録でのSNMPインターフェース追加について

いつもお世話になっております。

表題の件について、記憶があやふやで恐縮なのですが、デフォルトの状態で
監視対象のホストが応答しなくなった場合（削除されたなど）、自動的に
そのホストが無効になっていたような気がします。

ところが、いろいろトリガー・アイテム・アクション条件などをいじっているうちに
自動的に無効にならなくなってしまいました。

そこで、自動的にホストが無効になる条件はどのようなものか、ご教授いただけませんでしょうか？

「Zabbix 特定のホストの監視を無効化するスクリプト」
https://qiita.com/gitya107/items/359422e46fa5dc9ea08b

というのは見つけたのですが、これを使うのは最後の手段にしたいです。
（理由は単純にデフォルトの機能であるなら、そちらを使いたいというだけです）

環境
zabbix server OS : CentOS Linux release 7.3.1611 (Core)
zabbix server version : 3.0.10

zabbix server client OS : CentOS Linux release 7.3.1611 (Core)
zabbix agent : 3.0.10

↧

アイテムキー「system.run」の使い方について

August 6, 2018, 11:12 pm

≫ Next: sendmessage_smtp_php.sh でのPHPのエラー

≪ Previous: ホストが無効になる時の条件

お世話になっております。

あるディレクトリのファイル容量を監視して、指定容量を超えたらアラートを出す運用をしたいです。
アイテムキーに「system.run["du -bsL /var/log/hogehoge",wait]」と設定したのですが、

「Received value [7889340616 /var/log/hogehoge] is not suitable for value type [Numeric (unsigned)] and data type [Decimal]」

とエラーが出てしまいます。

Zabbixサーバーからzabbix_getコマンド実行したところ、
zabbix_get -s agent側IPアドレス -k system.run["du -bsL /var/log/hogehoge"]
7889340616 /var/log/hogehoge

と表示されたのでエージェントとの通信は問題ないと考えております。

原因となる箇所ご教授頂けますでしょうか。

サーバーとエージェントは共に3.0.19を利用しております。

よろしくお願いします。

↧

sendmessage_smtp_php.sh でのPHPのエラー

August 7, 2018, 1:14 am

≫ Next: web監視の仕様について

≪ Previous: アイテムキー「system.run」の使い方について

sendmessage_smtp_php.sh からGmailを利用したアラート通知を設定しております。

http://www.zabbix.jp/node/3044の記事などを参考に実施しておりますが、
PHP系のエラーが出て困っております。
事例やPHP側からの解決策などありましたら、ご教示いただけないでしょうか。

# ./sendmessage_smtp_php.sh xxxxx@gmail.com test test
PHP Warning: stream_socket_enable_crypto(): SSL: Connection reset by peer in /var/lib/zabbix/sendmessage-smtp-php/phpmailer/class.smtp.php on line 197
PHP Notice: fputs(): send of 6 bytes failed with errno=32 Broken pipe in /var/lib/zabbix/sendmessage-smtp-php/phpmailer/class.smtp.php on line 681
Language string failed to load: tls

↧

web監視の仕様について

August 7, 2018, 2:58 am

≫ Next: LLDで取得したVMのゲストOSを手動で任意のホストグループにまとめる方法

≪ Previous: sendmessage_smtp_php.sh でのPHPのエラー

RHEL7/zabbix3.0を使用してweb監視を実施し、レスポンスタイムを取得しております。
こちらの仕様につきまして皆様の知恵をお借りしたいです。
web監視実施時にキャッシュは残るものでしょうか？
また、そのキャッシュは定期的にweb監視をする場合、使われるものでしょうか？

背景としては
お客様にレスポンスタイムを可視化してほしいと依頼されており、
web監視で実現しようとしています。
web監視がキャッシュを使っていた場合、想定されるエンドユーザーとは違う挙動となるため、レスポンスタイムの取得が無意味となってしまいます。
想定されるエンドユーザーはキャッシュがない状態のアクセスですので、毎回、webサーバへアクセスし、ファイルを取得する場合のレスポンスタイムとなります。

大変お手数ですが、ご教授いただけないでしょうか。

↧

LLDで取得したVMのゲストOSを手動で任意のホストグループにまとめる方法

August 7, 2018, 3:42 pm

≫ Next: HPE 3PAR 8450(ストレージ)の監視について

≪ Previous: web監視の仕様について

タイトルの通り、LLDで取得してきたVMのゲストOSを
手動で任意のホストグループにまとめる方法があるか知りたいです。
※動作しているクラスターごとのホストグループが作成できるのは知っています

ホストグループ作成時にVMのゲストOSを指定しようとしても
VMのゲストOSはホスト一覧に表示されないため無理かな。。。と思ってはいますが
やり方があると知っている方がいましたらご教授いただきたいです。

↧

HPE 3PAR 8450(ストレージ)の監視について

August 7, 2018, 3:46 pm

≫ Next: トリガーの復旧時刻が過去の日時になる

≪ Previous: LLDで取得したVMのゲストOSを手動で任意のホストグループにまとめる方法

HPE 3PAR 8450の監視をしようと思っていますが、
なかなか良いテンプレートがネットには落ちておらず。。。
※スクリプトを使用したものはありましたが。。。

もしHPE 3PARの監視の知見を持っている方がいましたらご教授いただきたいです。

↧

トリガーの復旧時刻が過去の日時になる

August 7, 2018, 6:09 pm

≫ Next: mariadbのgeneral.logのエラーについて

≪ Previous: HPE 3PAR 8450(ストレージ)の監視について

お世話になっております。

Zabbix Proxyを利用して運用しています。
Proxy配下のZabbix Agent導入サーバから1時間に1,2回程度
Agentとの疎通が取れない旨の以下トリガーが発生します。

Zabbix agent on xxxx is unreachable for 5 minutes

しかし、Agent Pingのヒストリを見てみると、毎分データは
取得出来ており、途切れた形跡がありません。
また、数分後後に復旧するのですが、復旧時間が
なぜか、過去の時間になってしまいます。（添付参照）
ZabbixServer、Porxy、AgentとNTP時刻同期もしており、
いずれもズレはありません。

また、問題が発生しているProxyは1台だけで、その他同一
バージョンのProxy配下のAgentでは、問題が発生していません。
また、ZabbixServerログ、Proxyログ、Agentログにも不審な
出力はない状態です。
考えられる原因はなにかありますでしょうか。

どなたかご回答頂けると大変助かります。

【環境】
・Zabbix Server
　Zabbix：3.4.12
　OS：CentOS 6.10

・Zabbix Proxy
　Zabbix：3.4.12

↧

mariadbのgeneral.logのエラーについて

August 13, 2018, 1:01 am

≫ Next: zabbix障害検知アクションについて

≪ Previous: トリガーの復旧時刻が過去の日時になる

いつもお世話になっております。
以下のようなエラーが出るのですがどういう状態かご教授いただけますでしょうか。

■mariadb　general.log
77 Query insert into history_log (itemid,clock,ns,timestamp,source,severity,value,logeventid) values (61737,1534135131,739575190,0,'',0,'< 2018-08-13 13:38:30.322 JST >ERROR: 重複キーが一意性制約"pk_hshdt_audit_basic"に違反しています',0),(43196,1534135512,875998293,0,'',0,'< 2018-08-13 13:42:08.839 JST >ERROR: 現在のトランザクションがアボートしました。トランザクションブロックが終わるまでコマンドは無視されます',0)

■mariadb　mariadb.log　log_warnings=4
180813 16:49:33 [Warning] Aborted connection 102448 to db: 'zabbix' user: 'zabbix' host: 'localhost' (CLOSE_CONNECTION)

↧

zabbix障害検知アクションについて

August 14, 2018, 8:37 pm

≫ Next: LLDで取得したアイテムを計算アイテムとして値を利用したい。

≪ Previous: mariadbのgeneral.logのエラーについて

zabbixで監視しているサーバからzabbixエージェント監視に関する障害の通知が表示されました。
対象サーバのzabbix-agentd.logに下記のようなエラーを確認しました。

active check configuration update from [xxx.xxx.xxx.xxx:10051] started to fail (ZBX_TCP_READ() timed out)
active check configuration update from [xxx.xxx.xxx.xxx:10051] is working again

6分ほどで正常に検知できているようなのですが、zabbixマネジメントコンソールで設定しているグラフの対象時間を確認しましたが、
グラフも特に途切れているといった状態ではありませんでした。
（アクションログではエラー通知のログが残っている）

原因特定をしたいと考えておりますが、その他のログには特に異常や問題となり得そうな情報が無かったため、
何か助言いただければ幸いです。
グラフの状況との差異についても併せてご教授いただければと存じます。

【構成】
OS：Amazon Linux
zabbix： 3.4.8

↧

LLDで取得したアイテムを計算アイテムとして値を利用したい。

August 14, 2018, 9:40 pm

≫ Next: ESXiホストの監視時、ストレージ情報の更新と言うログが大量に出るようになった

≪ Previous: zabbix障害検知アクションについて

計算アイテムの利用方法でご教授願います。。

普通に登録しているアイテムの値を利用した計算アイテムの作成は問題なかったのですが
LLDで取得しているアイテムを計算アイテムとして利用したいと思っています。
vfs.fs.discoveryで取得している情報を元に
計算アイテムとしてテンプレートに登録を行いたいのですが可能でしょうか？

現状、LLDで取得しているアイテムを確認してから別途アイテムを登録する方法で考えています。
計算式には#FSNAME等使えないのでしょうか？

任意の時間前の計算アイテムを作成しようと以下のような計算式を考えています。
last("vfs.fs.inode[{#FSNAME},pfree]",0,{$DATE})
※$DATEはマクロで登録し任意の時間前を一括変更しようとしています。

何かいい方法があればご教授ください。

↧

ESXiホストの監視時、ストレージ情報の更新と言うログが大量に出るようになった

August 16, 2018, 7:05 pm

≫ Next: ZABBIXマネージャからＪＰ１（ＩＭ－ＶＩＥＷ）への転送（連携）について

≪ Previous: LLDで取得したアイテムを計算アイテムとして値を利用したい。

タイミングとしてはzabbix3.4.11から3.4.12へバージョンアップしてから、だと思われるのですが、
監視しているVMWare ESXiホスト(バージョンは様々)のログに
ストレージ情報の更新　と言う物が大量に出るようになりました。

Template Virt VMware Hypervisor　のアイテム(ディスカバリ内)
Average read latency of the datastore {#DATASTORE} および Average write latency of the datastore {#DATASTORE}
に関連する物と思われるのですが、今まで出現していなかったログなので、他の方々も同様なのか切り分けたくフォーラムを作成しました。

ESXi6.5等のホストでは、ブラウザ上から管理コンソールにアクセスする形になるのですが、該当ログのせいなのか非常に重くなってしまい
まともに操作ができなくなっています。
3.4.12のリリースノートに　ZBX-14548　fixed the disk usage counters reading for ESX/ESXi hosts 　の項目があるため、この変更による物と推測していますが、
同じような症状が出ている方、いらっしゃるでしょうか？

↧