こんにちは。最近仮想アプライアンスサーバが広まってきていますが、
ちょっと調べた感じだとZabbixで仮想アプライアンスサーバは監視できないのでしょうか。
もし仮想アプライアンスサーバの監視について知見を持っている方がいればご教授いただきたいです。
こんにちは。最近仮想アプライアンスサーバが広まってきていますが、
ちょっと調べた感じだとZabbixで仮想アプライアンスサーバは監視できないのでしょうか。
もし仮想アプライアンスサーバの監視について知見を持っている方がいればご教授いただきたいです。
いつも参考にさせていただいております。
ノードマップのアイコンをクリックすると、
該当ノードにsshでログインできるようなことが実現できるでしょうか?
https://www.zabbix.com/documentation/3.4/manual/web_interface/frontend_s...
以下は実現案の一つです。
Windowsクライアントでマップを表示し、障害が発生したノードがハイライト表示されて、
クリックするとTeraTermマクロが起動して、ユーザ名とパスワード、IPアドレスを
引数で渡すと、そのノードにログインできる、といったようなことができると理想だと思っています。
もしくは、ユーザ名と秘密鍵を引数に渡してログインするなど。
その他に実現可能な案があればご教示いただきたく。
どうぞ、よろしくお願いいたします。
いつもお世話になっております。
アクション実行について質問させてください。
アクション(メール通知)が遅延する事象が発生しており、対応に苦慮しております。
対策としては、現在のバージョン(3.0)を3.4へのバージョンアップし、
alerter processesが多重で起動できるよう設定を行うことだと考えておりますが
以下の相談内容にご助言いただけると助かります。
■環境
CPU:Xeon プロセッサー E3-1220v6(3GHz/4コア/8MB)×1
メモリ:8GB(8GB 2400 UDIMM×1)
ディスク:300GB
ZabbixVersion:Zabbix-Server 3.0
■事象
・アクション(メール通知)が一時間に100件程度実行される環境において、
alerter processesが100%となり、アクション(メール通知)が遅延する事象が発生しております。
■相談内容
・CPU、メモリ等のリソースは落ち着いており、alerter processesのみ100%となる状況です。
そのため、サーバ性能にかかわるものではないと仮定しておりますが一般的に
「アクション(メール通知)が継続的に一時間に100件程度実行される環境」の場合、
CentOSにZabbixをインストールしたサーバー1台の構成で、
10台程度のルータをPingで監視したいと考えています。
9台のルータは問題なく監視ができていますが、
1台のルータだけコマンドでのping、fpingは応答がありますが、
Zabbixのicmppingで監視すると、「0(Down)」の状態になります。
テンプレート「Template Module ICMP Ping」を適用しても、
「ICMP loss」は「100%」、「ICMP response time」は「0」となります。
何か確認すべき点などはありますでしょうか。
・ping、fpingの結果は次の通りです。
# ping xx.xx.xx.xx
PING xx.xx.xx.xx (xx.xx.xx.xx) 56(84) bytes of data.
64 bytes from yy.yy.yy.yy: icmp_seq=1 ttl=252 time=8.42 ms
64 bytes from yy.yy.yy.yy: icmp_seq=2 ttl=252 time=8.45 ms
# fping xx.xx.xx.xx
xx.xx.xx.xx is alive [<- yy.yy.yy.yy]
お世話になっております。
agent自動登録機能を利用して、ホストをWebUIに反映するとき、HostnameItem=system.hostname の設定をしました。
ここでSNMPインターフェースが反映されないので、action機能のRemote Commandを利用してshell script を実行して登録するよう設定しました。
しかし、いざ実行すると、以下のエラーが出てしまいます。
1.cannot link template(s) "xxxxxxxxxxxxx" to host "host123": cannot find "SNMP" host interface
2.cannot send list of active checks to "xx.yy.0.zz": host [host123] not found
と出てしまいます。
上記の解決策をネットで調べましたが適切なものが見当たりません。
そこで上記の解決策について、ご教示いただけますでしょうか。
【バージョン】
◆zabbix_server:3.4.11
【参考サイト】
http://u0sa0.hateblo.jp/entry/2013/11/03/020058
http://www.zabbix.jp/node/2477
いつもお世話になっております。
表題の件について、記憶があやふやで恐縮なのですが、デフォルトの状態で
監視対象のホストが応答しなくなった場合(削除されたなど)、自動的に
そのホストが無効になっていたような気がします。
ところが、いろいろトリガー・アイテム・アクション条件などをいじっているうちに
自動的に無効にならなくなってしまいました。
そこで、自動的にホストが無効になる条件はどのようなものか、ご教授いただけませんでしょうか?
「Zabbix 特定のホストの監視を無効化するスクリプト」
https://qiita.com/gitya107/items/359422e46fa5dc9ea08b
というのは見つけたのですが、これを使うのは最後の手段にしたいです。
(理由は単純にデフォルトの機能であるなら、そちらを使いたいというだけです)
環境
zabbix server OS : CentOS Linux release 7.3.1611 (Core)
zabbix server version : 3.0.10
zabbix server client OS : CentOS Linux release 7.3.1611 (Core)
zabbix agent : 3.0.10
お世話になっております。
あるディレクトリのファイル容量を監視して、指定容量を超えたらアラートを出す運用をしたいです。
アイテムキーに「system.run["du -bsL /var/log/hogehoge",wait]」と設定したのですが、
「Received value [7889340616 /var/log/hogehoge] is not suitable for value type [Numeric (unsigned)] and data type [Decimal]」
とエラーが出てしまいます。
Zabbixサーバーからzabbix_getコマンド実行したところ、
zabbix_get -s agent側IPアドレス -k system.run["du -bsL /var/log/hogehoge"]
7889340616 /var/log/hogehoge
と表示されたのでエージェントとの通信は問題ないと考えております。
原因となる箇所ご教授頂けますでしょうか。
サーバーとエージェントは共に3.0.19を利用しております。
よろしくお願いします。
sendmessage_smtp_php.sh からGmailを利用したアラート通知を設定しております。
http://www.zabbix.jp/node/3044の記事などを参考に実施しておりますが、
PHP系のエラーが出て困っております。
事例やPHP側からの解決策などありましたら、ご教示いただけないでしょうか。
# ./sendmessage_smtp_php.sh xxxxx@gmail.com test test
PHP Warning: stream_socket_enable_crypto(): SSL: Connection reset by peer in /var/lib/zabbix/sendmessage-smtp-php/phpmailer/class.smtp.php on line 197
PHP Notice: fputs(): send of 6 bytes failed with errno=32 Broken pipe in /var/lib/zabbix/sendmessage-smtp-php/phpmailer/class.smtp.php on line 681
Language string failed to load: tls
RHEL7/zabbix3.0を使用してweb監視を実施し、レスポンスタイムを取得しております。
こちらの仕様につきまして皆様の知恵をお借りしたいです。
web監視実施時にキャッシュは残るものでしょうか?
また、そのキャッシュは定期的にweb監視をする場合、使われるものでしょうか?
背景としては
お客様にレスポンスタイムを可視化してほしいと依頼されており、
web監視で実現しようとしています。
web監視がキャッシュを使っていた場合、想定されるエンドユーザーとは違う挙動となるため、レスポンスタイムの取得が無意味となってしまいます。
想定されるエンドユーザーはキャッシュがない状態のアクセスですので、毎回、webサーバへアクセスし、ファイルを取得する場合のレスポンスタイムとなります。
大変お手数ですが、ご教授いただけないでしょうか。
タイトルの通り、LLDで取得してきたVMのゲストOSを
手動で任意のホストグループにまとめる方法があるか知りたいです。
※動作しているクラスターごとのホストグループが作成できるのは知っています
ホストグループ作成時にVMのゲストOSを指定しようとしても
VMのゲストOSはホスト一覧に表示されないため無理かな。。。と思ってはいますが
やり方があると知っている方がいましたらご教授いただきたいです。
HPE 3PAR 8450の監視をしようと思っていますが、
なかなか良いテンプレートがネットには落ちておらず。。。
※スクリプトを使用したものはありましたが。。。
もしHPE 3PARの監視の知見を持っている方がいましたらご教授いただきたいです。
お世話になっております。
Zabbix Proxyを利用して運用しています。
Proxy配下のZabbix Agent導入サーバから1時間に1,2回程度
Agentとの疎通が取れない旨の以下トリガーが発生します。
Zabbix agent on xxxx is unreachable for 5 minutes
しかし、Agent Pingのヒストリを見てみると、毎分データは
取得出来ており、途切れた形跡がありません。
また、数分後後に復旧するのですが、復旧時間が
なぜか、過去の時間になってしまいます。(添付参照)
ZabbixServer、Porxy、AgentとNTP時刻同期もしており、
いずれもズレはありません。
また、問題が発生しているProxyは1台だけで、その他同一
バージョンのProxy配下のAgentでは、問題が発生していません。
また、ZabbixServerログ、Proxyログ、Agentログにも不審な
出力はない状態です。
考えられる原因はなにかありますでしょうか。
どなたかご回答頂けると大変助かります。
【環境】
・Zabbix Server
Zabbix:3.4.12
OS:CentOS 6.10
・Zabbix Proxy
Zabbix:3.4.12
いつもお世話になっております。
以下のようなエラーが出るのですがどういう状態かご教授いただけますでしょうか。
■mariadb general.log
77 Query insert into history_log (itemid,clock,ns,timestamp,source,severity,value,logeventid) values (61737,1534135131,739575190,0,'',0,'< 2018-08-13 13:38:30.322 JST >ERROR: 重複キーが一意性制約"pk_hshdt_audit_basic"に違反しています',0),(43196,1534135512,875998293,0,'',0,'< 2018-08-13 13:42:08.839 JST >ERROR: 現在のトランザクションがアボートしました。トランザクションブロックが終わるまでコマンドは無視されます',0)
■mariadb mariadb.log log_warnings=4
180813 16:49:33 [Warning] Aborted connection 102448 to db: 'zabbix' user: 'zabbix' host: 'localhost' (CLOSE_CONNECTION)
zabbixで監視しているサーバからzabbixエージェント監視に関する障害の通知が表示されました。
対象サーバのzabbix-agentd.logに下記のようなエラーを確認しました。
active check configuration update from [xxx.xxx.xxx.xxx:10051] started to fail (ZBX_TCP_READ() timed out)
active check configuration update from [xxx.xxx.xxx.xxx:10051] is working again
6分ほどで正常に検知できているようなのですが、zabbixマネジメントコンソールで設定しているグラフの対象時間を確認しましたが、
グラフも特に途切れているといった状態ではありませんでした。
(アクションログではエラー通知のログが残っている)
原因特定をしたいと考えておりますが、その他のログには特に異常や問題となり得そうな情報が無かったため、
何か助言いただければ幸いです。
グラフの状況との差異についても併せてご教授いただければと存じます。
【構成】
OS:Amazon Linux
zabbix: 3.4.8
計算アイテムの利用方法でご教授願います。。
普通に登録しているアイテムの値を利用した計算アイテムの作成は問題なかったのですが
LLDで取得しているアイテムを計算アイテムとして利用したいと思っています。
vfs.fs.discoveryで取得している情報を元に
計算アイテムとしてテンプレートに登録を行いたいのですが可能でしょうか?
現状、LLDで取得しているアイテムを確認してから別途アイテムを登録する方法で考えています。
計算式には#FSNAME等使えないのでしょうか?
任意の時間前の計算アイテムを作成しようと以下のような計算式を考えています。
last("vfs.fs.inode[{#FSNAME},pfree]",0,{$DATE})
※$DATEはマクロで登録し任意の時間前を一括変更しようとしています。
何かいい方法があればご教授ください。
タイミングとしてはzabbix3.4.11から3.4.12へバージョンアップしてから、だと思われるのですが、
監視しているVMWare ESXiホスト(バージョンは様々)のログに
ストレージ情報の更新 と言う物が大量に出るようになりました。
Template Virt VMware Hypervisor のアイテム(ディスカバリ内)
Average read latency of the datastore {#DATASTORE} および Average write latency of the datastore {#DATASTORE}
に関連する物と思われるのですが、今まで出現していなかったログなので、他の方々も同様なのか切り分けたくフォーラムを作成しました。
ESXi6.5等のホストでは、ブラウザ上から管理コンソールにアクセスする形になるのですが、該当ログのせいなのか非常に重くなってしまい
まともに操作ができなくなっています。
3.4.12のリリースノートに ZBX-14548 fixed the disk usage counters reading for ESX/ESXi hosts の項目があるため、この変更による物と推測していますが、
同じような症状が出ている方、いらっしゃるでしょうか?
ZABBIXマネージャで検知したアラートメッセージ(※)をJP1ーIMに転送し。
IM-view画面にてエラー内容を参照したいと考えております。
(※)監視対象サーバのCPU、メモリ、ファイル使用率等の閾値超え、ログファイル監視等
ZABBIXのローカルアクションにてJP1の転送コマンド(jevsend)等を実行することで実現可能と
勝手に思っておりますが、検証環境がない状態で自信がありません。
上記のような仕様は実現可能でしょうか?
ざっくりとした質問で申し訳ございませんが、お分かりの方がいらっしゃいましたらご教示頂けないでしょうか。
宜しくお願いします。
コミュニティーの皆様
お世話になります。
TT2018と申します。
お手数おかけしますが、ご教授の程よろしくお願いいたします。
【実施環境】
zabbix Server 3.4.7
OS red hat(バージョンは分かりません)
zabbix agent 3.4.7
OS windows Server 2016
【実施したいこと】
windowsの特定のフォルダに、1分毎にlog_yyyymmddhhmmss.csv(例:log_20180819154544.csv)のログが生成されます。
logファイルの数は、時間経過と共にフォルダの中で増えてゆきます。
作成日時が最も新しいlogファイルと現在時刻を比較して、
5分以上開きがあると、アラート検知するためには、どのような設定が必要でしょうか。
※
特定のフォルダ C:\Users\test\AppData\Roaming\test\log
【補足情報】
外部サイトで、今回やりたいことのやり方と思われる情報を見つけ、実施しました。
http://q.hatena.ne.jp/1506047625
しかし、何かしらの不備があるため、実施出来ておりません。
現在時刻とlogに開きがなくても下記のようなメッセージを検知します。
お世話になります。
kekeと申します。
コミュニティの皆さまご教示の程何卒宜しくお願い致します。
当方、zabbix3.0.10を使用しています。
表題の通り、Webシナリオ監視でエラーを検知した場合、
どのステップで失敗しているのか、または原因がわかる詳細を、
メッセージに表示する様にしたく考えております。
例えば、添付のエラーティップの内容を表示するようなマクロがあれば
それを埋め込むことで、要望が実現できると思うのですが、その様なマクロはありますでしょうか?
以上、よろしくお願い致します。
ご存知の方がおられましたらアドバイスいただけると幸いです。
【環境】 zabbix3.0.7
Zabbix標準テンプレートの「Template OS Windows」を関連付けたホストがあります。
ディスカバリで見つかったドライブの容量が閾値を超えてトリガーが発動し、
設定したアクションにより通知が行われました。
このアクションは1日1回通知が行われるように
「デフォルトのアクション実行ステップの間隔」:86400
「ステップ」:1-0
と設定しており正常に稼働しておりました。
そのような状況で、長期間このトリガー検知状態にあったホストのアクション通知が
ある日突然通知されなくなりました。
アイテム自体は正常に値を取得しており、閾値を超える値のままであることが
確認できています。
一旦閾値を変更し、トリガーが検知しない状況にしてもアクションの復旧通知が
行われませんでした。
(アクションの設定は復旧通知が行われるようにしてあり、普段は復旧通知が行われています)
そこでお尋ねしたいのですが、一定期間トリガー検知状態にあると
アクション通知が行われなくなることがあるのでしょうか?
Zabbixの「管理」-「一般設定」-「データの保存期間」にある
「トリガーデータ保存期間(日)」を超えると通知されなくなるのでは、と