環境説明:
DB:MySQL 5.7 (AWS Aurora)
→ RDSのエンドポイントをRoute53に登録して接続しているのではなく、RDSエンドポイントと直接接続しています。
→ Zabbixサーバーからはライター用のエンドポイントを指定しています。
→ RDS Proxy は使用していません。
ZabbixServer:5.0.12
→ AWSのEC2でZabbixサーバーを構築しています。
■事象
RDSの障害にてRDSのフェイルオーバーが発生した際、ZabbixサーバーからRDSへ接続されない状態が継続致しました。
ZabbixサーバーのGUIにはアクセスできましたが、監視アイテムの最新値がフェイルオーバーが発生した時刻から更新が無い状況でした。
ログには「slow query」や「[Z3005] query failed: [1041] Out of memory」、
「[Z3005] query failed: [2013] Lost connection to MySQL server during query」が出力されておりました。
zabbix_serverを再起動した所復旧致しましたが、復旧までの間、監視アイテムのデータが取得できておりませんでした。
・時系列