[Linux-ha-jp] Pacemakerの縮退中の監視について

Back to archive index
Mao Shibata shiba****@ryobi*****
2020年 4月 28日 (火) 17:24:45 JST


山内さん

お世話になります。柴田です。

ご回答ありがとうございます。

リソース増強、タイムアウト延長が必要なことは重々承知しており
タイムアウトについては想定する高負荷に応じて変更予定になります。
しかし、(基本発生してはいけませんが)想定以上の高負荷がもし仮に
縮退運転中に発生してしまった場合、スレーブ側が存在しないにも関わらず、
フェイルオーバーを発生させてしまうこと自体問題であるととらえています。

縮退運転になった場合、監視を抑止するために直ちにメンテナンスモードに
移行すれば停止は避けられると考えているのですが、他に良い方法は
ないでしょうか?
他のクラスタ製品では縮退運転中であれば異常は検知するものの
フェイルオーバーは発生させない仕様になっていたりするのですが、
Pacemakerでも同様の振る舞いはできないものでしょうか?

重ね重ねの質問で申し訳ございませんが、よろしくお願いいたします。

> -----Original Message-----
> From: renay****@ybb***** <renay****@ybb*****>
> Sent: Tuesday, April 28, 2020 3:08 AM
> To: linux****@lists*****
> Subject: Re: [Linux-ha-jp] Pacemakerの縮退中の監視について
> 
> 柴田さん
> 
> こんばんは、山内です。
> 
> 縮退運転中に高負荷が発生しているとのことですが、どの程度の高負荷が起きてい
> るのか
> sarなどで確認をされた方が良いかと思います。
> 
> もし、仮に想定通りとされている両系運用中と同様の高負荷が、縮退運転中にも起
> きているのであれば、
> やはりCPUなどのリソースが不足していることが要因と思われますので、タイム
> アウトなどの延長が必要なのではないでしょうか?
> 
> >異常ノード復旧前(片系運用中)に再度高負荷が発生しタイムアウトを検知?
> >して両系ダウンとなります。
> 
> 
> 一度、可能な範囲でログの開示などしていただけると良いかも知れません。
> 
> 以上です。
> 
> 
> 
> ----- Original Message -----
> >From: Mao Shibata <shiba****@ryobi*****>
> >To: linux****@lists*****
> >Date: 2020/4/21, Tue 14:53
> >Subject: [Linux-ha-jp] Pacemakerの縮退中の監視について
> >
> >初めて投稿させていただきます。
> >柴田と申します。
> >
> >DBサーバ(PostgreSQLレプリケーション構成)を
> >Pacemaker+Corosyncを使用してHAクラスタ構成としています。
> >
> >高負荷時にPostgreSQLのリソースエージェントがタイムアウトを検知して
> >フェイルオーバが発生します。(max_connectionsは使い切っていない)
> >ここまでは想定通りなのですが、フェイルオーバーが発生したあと
> >異常ノード復旧前(片系運用中)に再度高負荷が発生しタイムアウトを検知?
> >して両系ダウンとなります。
> >高負荷を考慮してタイムアウト時間を長くするという認識はあるのですが、
> >片系運用中に異常検知してDBプロセスを落とすのは避けたいです。
> >
> >回避策などご存じの方がいましたら、ご教授ください。
> >よろしくお願いいたします。
> >
> >_______________________________________________
> >Linux-ha-japan mailing list
> >Linux****@lists*****
> >https://lists.osdn.me/mailman/listinfo/linux-ha-japan
> >
> >
> >



Linux-ha-japan メーリングリストの案内
Back to archive index