[Linux-ha-jp] スプリットブレイン時の回復方法

Back to archive index

mlus mlus****@39596*****
2014年 1月 23日 (木) 20:27:21 JST


コヤマです。

ヒバリさんに、ご教授頂いた内容を試してみました。


> これまでのやり取りで、高塚さまからスプリットブレインの回避策として
> 話が出ておりましたが、両系のホストで同じVIPが作成されないように
> するため「vipcheck」を利用すると良いです。

残念な事に、VIPcheck というリソースは、利用している
resource-agents-3.9.5-2.4.1
には、含まれていませんでした。VIPAripというのはありましたが、
ちょっと内容が違うように思います。


>>  両ホストのHAはこの状態のまま稼動させたままで、どのように復旧させるか?
> スプリットブレインからの復旧の際、両系のHAを停止する必要は
> ありません。
>
> インターコネクトLANの疎通が復旧していることを確認した後、
> vipcheckで失敗し、それ以降のリソースが起動されなくなって
> いる側のhostのPacemakerを再起動、もしくはhostそのものを
> 再起動すれば復旧できます。
>

2つのパターンでやってみました。

***> host2 の corosync 及び  pacemakerを再起動

Last updated: Thu Jan 23 19:33:45 2014
Last change: Thu Jan 23 19:29:44 2014 by hacluster via crmd on host1
Stack: corosync
Current DC: host1 (2886926337) - partition with quorum
Version: 1.1.10-1.2-d9bb763
3 Nodes configured
5 Resources configured


Online: [ host2 host1 ]
OFFLINE: [ host1 ]

Full list of resources:

 Resource Group: grp
     v_ip       (ocf::heartbeat:IPaddr2):       Started host1
     failmail   (ocf::heartbeat:MailTo):        Started host1
 Clone Set: clone_v_ping [v_ping]
     Started: [ host2 host1 ]

Node Attributes:
* Node host2:
    + pingcheck                         : 100
* Node host1:
    + pingcheck                         : 100

Migration summary:* Node host1: * Node host2:




ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
host2の pacemakerのみ 停止・起動

Last updated: Thu Jan 23 19:43:00 2014
Last change: Thu Jan 23 19:39:24 2014 by hacluster via crmd on host1
Stack: corosync
Current DC: host1 (2886926337) - partition with quorum
Version: 1.1.10-1.2-d9bb763
3 Nodes configured
5 Resources configured


Online: [ host2 host1 ]
OFFLINE: [ host1 ]

Full list of resources:

 Resource Group: grp
     v_ip       (ocf::heartbeat:IPaddr2):       Started host1
     failmail   (ocf::heartbeat:MailTo):        Started host1
 Clone Set: clone_v_ping [v_ping]
     Started: [ host2 host1 ]

Node Attributes:
* Node host2:
    + pingcheck                         : 100
* Node host1:
    + pingcheck                         : 100

Migration summary:* Node host1: * Node host2:
-----------------------------------------------------------------------

結果として、同じ結果になりました。
# ip addr show
を行っても、ちゃんと host1にて仮想アドレスが作成され、host2にはされていないので、
稼動には問題なさそうなんですが、

**********************************
3 Nodes configured
5 Resources configured

Online: [ host2 host1 ]
OFFLINE: [ host1 ]
***********************************

この部分の表示が大変気になります。





Linux-ha-japan メーリングリストの案内
Back to archive index