[Linux-ha-jp] Re: スプリットブレイン時の回復方法

Back to archive index

kazuh****@goo***** kazuh****@goo*****
2014年 1月 24日 (金) 09:40:18 JST


コヤマさん

ヒガシと申します。

VIPcheckはpm_extrasというパッケージに含まれます。

RHEL6用のrpmならここにあります。
(逐次最新版に上書きされていくためご注意ください。)
corosync,pacemaker 1.1をお使いなら
pm_extras-2.0-1.el6.x86_64.rpm
が最新です。(1.4-1はPacemaker1.0用のため注意)

http://linux-ha.sourceforge.jp/nightly/


ソースはここです。
https://github.com/linux-ha-japan/pm_extras


取り急ぎ以上です。よろしくお願いいたします。

2014/01/23 (Thu) 20:27, "mlus" <mlus****@39596*****> wrote:
> コヤマです。
> 
> ヒバリさんに、ご教授頂いた内容を試してみました。
> 
> 
> > これまでのやり取りで、高塚さまからスプリットブレインの回避策として
> > 話が出ておりましたが、両系のホストで同じVIPが作成されないように
> > するため「vipcheck」を利用すると良いです。
> 
> 残念な事に、VIPcheck というリソースは、利用している
> resource-agents-3.9.5-2.4.1
> には、含まれていませんでした。VIPAripというのはありましたが、
> ちょっと内容が違うように思います。
> 
> 
> >>  両ホストのHAはこの状態のまま稼動させたままで、どのように復旧させるか?
> > スプリットブレインからの復旧の際、両系のHAを停止する必要は
> > ありません。
> >
> > インターコネクトLANの疎通が復旧していることを確認した後、
> > vipcheckで失敗し、それ以降のリソースが起動されなくなって
> > いる側のhostのPacemakerを再起動、もしくはhostそのものを
> > 再起動すれば復旧できます。
> >
> 
> 2つのパターンでやってみました。
> 
> ***> host2 の corosync 及び  pacemakerを再起動
> 
> Last updated: Thu Jan 23 19:33:45 2014
> Last change: Thu Jan 23 19:29:44 2014 by hacluster via crmd on host1
> Stack: corosync
> Current DC: host1 (2886926337) - partition with quorum
> Version: 1.1.10-1.2-d9bb763
> 3 Nodes configured
> 5 Resources configured
> 
> 
> Online: [ host2 host1 ]
> OFFLINE: [ host1 ]
> 
> Full list of resources:
> 
>  Resource Group: grp
>      v_ip       (ocf::heartbeat:IPaddr2):       Started host1
>      failmail   (ocf::heartbeat:MailTo):        Started host1
>  Clone Set: clone_v_ping [v_ping]
>      Started: [ host2 host1 ]
> 
> Node Attributes:
> * Node host2:
>     + pingcheck                         : 100
> * Node host1:
>     + pingcheck                         : 100
> 
> Migration summary:* Node host1: * Node host2:
> 
> 
> 
> 
> ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー
> host2の pacemakerのみ 停止・起動
> 
> Last updated: Thu Jan 23 19:43:00 2014
> Last change: Thu Jan 23 19:39:24 2014 by hacluster via crmd on host1
> Stack: corosync
> Current DC: host1 (2886926337) - partition with quorum
> Version: 1.1.10-1.2-d9bb763
> 3 Nodes configured
> 5 Resources configured
> 
> 
> Online: [ host2 host1 ]
> OFFLINE: [ host1 ]
> 
> Full list of resources:
> 
>  Resource Group: grp
>      v_ip       (ocf::heartbeat:IPaddr2):       Started host1
>      failmail   (ocf::heartbeat:MailTo):        Started host1
>  Clone Set: clone_v_ping [v_ping]
>      Started: [ host2 host1 ]
> 
> Node Attributes:
> * Node host2:
>     + pingcheck                         : 100
> * Node host1:
>     + pingcheck                         : 100
> 
> Migration summary:* Node host1: * Node host2:
> -----------------------------------------------------------------------
> 
> 結果として、同じ結果になりました。
> # ip addr show
> を行っても、ちゃんと host1にて仮想アドレスが作成され、host2にはされていないので、
> 稼動には問題なさそうなんですが、
> 
> **********************************
> 3 Nodes configured
> 5 Resources configured
> 
> Online: [ host2 host1 ]
> OFFLINE: [ host1 ]
> ***********************************
> 
> この部分の表示が大変気になります。
> 
> _______________________________________________
> Linux-ha-japan mailing list
> Linux****@lists*****
> http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
> 





Linux-ha-japan メーリングリストの案内
Back to archive index