[Linux-ha-jp] 片側ノードをリブート後の heartbeat 動作について

Back to archive index

y-tao****@pb***** y-tao****@pb*****
2009年 6月 24日 (水) 12:07:51 JST


山内様

峠です。

了解しました。

2.1.4へ移行してみようと思います。
移行結果は後日ご報告させていただきます。

深夜まで確認作業を行っていただいたようで
申し訳ありませんでした。
ご指導いただきありがとうございました。

以上です。

> 峠さん
> 
> こんばんは、メイトリックスの山内です。
> 
> まったく同じ環境ではありませんが、以下のVM上の2ノードで確認しました。
> 
> ・CentOS 4.7 (x64)
> ・Heartbeat 2.1.3-STABLE(ソースからインストール)
> 
> 上記の環境では、いくら、cl_status hb_statusをたたいても、stoppedでしか表示されませんでした。
> #お使いのrpmと若干、バージョンの違いもあるのかも知れません。
> 
> ちなみに、2.1.4-STABLE版(ソースからインストール)では、各ノード起動後、片系リブート後のHeartbeat起
> 動後もcl_statusでただしく起動が確認できました。
> 
> 2.1.3の問題かも知れませんので、ぜひ、2.1.4の環境への移行を考慮していただければと思います。
> 
> また、2.1.3での問題回避のために、crm_monなど別途コマンドを利用してのオンライン状態を確認して頂くか、ps
> などで実際の起動プロセスの確認、tcpdumpなどでの通信状態の確認をあわせて利用するような形が必要かと思
> います。
> 
> 以上、よろしくお願いいたします。
> 
> 
> --- y-tao****@pb***** wrote:
> 
>> 山内様
>> 
>> 峠です。
>> コメントありがとうございます。
>> 
>> (1)cib.xmlを使用していますのでV2モードだと思います。
>>  この認識で正しいでしょうか?
>> 
>> (2)Heartbeatのchkconfigは
>>  各ノードとも2〜5をonとしています。
>> 
>> (3)initdeadの値は60にしていて、
>>  試験的に120に変更しても現象は変わりませんでした。
>> 
>> ha.cf/cib.xmlの内容は下記の通りです。
>> 
>> -ha.cf------------------------
>> crm on
>> debugfile /var/log/ha-debug
>> logfile /var/log/ha-log
>> deadtime 30
>> deadping 40
>> warntime 10
>> initdead 60
>> node aaaa001
>> node aaaa002
>> udpport 694
>> ucast bond0 172.16.101.102
>> ------------------------------
>> 
>> -cib.xml----------------------
>>  <cib generated="false" admin_epoch="0" have_quorum="false" ignore_dtd="false" num_peers="2"
>> cib_feature_revision="2.0" epoch="5" num_updates="2" cib-last-written="Tue Jun 23 13:45:55
>> 2009">
>>    <configuration>
>>      <crm_config>
>>        <cluster_property_set id="cib-bootstrap-options">
>>          <attributes>
>>            <nvpair id="failback" name="default_resource_stickiness" value="INFINITY"/>
>>            <nvpair id="cib-bootstrap-options-dc-version" name="dc-version" value="2.1.3-node:
>> 5523・・・省略・・・26a3"/>
>>          </attributes>
>>        </cluster_property_set>
>>      </crm_config>
>>      <nodes>
>>        <node id="08c8・・・省略・・・2b37" uname="aaaa002" type="normal"/>
>>        <node id="c19f・・・省略・・・bcf1" uname="aaaa001" type="normal"/>
>>      </nodes>
>>      <resources>
>>        <group id="grpTest">
>>          <primitive id="prmIpTest" class="ocf" type="IPaddr" provider="heartbeat">
>>            <instance_attributes id="atrIpTest">
>>              <attributes>
>>                <nvpair id="ipTest" name="ip" value="172.16.101.103"/>
>>                <nvpair id="maskTest" name="netmask" value="24"/>
>>                <nvpair id="nicTest" name="nic" value="bond0"/>
>>              </attributes>
>>            </instance_attributes>
>>          </primitive>
>>          <primitive id="prmAAAAA" class="ocf" type="aaaaa-check" provider="heartbeat">
>>            <instance_attributes id="atrAAAAA">
>>              <attributes/>
>>            </instance_attributes>
>>            <operations>
>>              <op id="opAAAAA" name="monitor" interval="60s" timeout="30s"/>
>>            </operations>
>>          </primitive>
>>        </group>
>>      </resources>
>>      <constraints/>
>>    </configuration>
>>  </cib>
>> ------------------------------
>> 
>> 以上、よろしくお願いします。
>> 
>> > 峠さん
>> > 
>> > こんにちは、メイトリックスの山内です。
>> > 
>> > 下記のHeartbeat環境ですが、V1モードでご利用でしょうか?それともV2モードでご利用でしょうか?
>> > また、各ノードのHeartbeatのchkconfigなどはどうなっておりますでしょうか?
>> > 
>> > 感覚的には、initdead設定あたりが短いのではないかと思いますが、如何でしょうか?
>> > 
>> > #出来れば、お見せいただける範囲で、ha.cfや、cib.xmlなどを添付していただけると助かります。
>> > 
>> > 以上、よろしくお願いいたします。
>> > 
>> >>お世話になっております。
>> >>峠 と申します。
>> >>
>> >>Heartbeatの下記現象について、
>> >>経験・知識などをお持ちの方がいましたら
>> >>ご指導いただきたいと思います。
>> >>
>> >>
>> >>・環境
>> >> CentOS4.6
>> >> Heartbeat 2.1.3-3.el4.centos
>> >> ノード2台構成
>> >>
>> >>・現象
>> >> 片側ノード(マシン)をリブートすると
>> >> そのリブートしたノードはofflineのままとなり、
>> >> offlineのノードの状態をcl_statusで見てみると
>> >> 「heartbeat stop on this machine」となっています。
>> >>
>> >> この後、両ノードを
>> >> 「リブートするか、heartbeatをstop/startする」
>> >> ことによりonlineに戻ります。
>> >>
>> >> この現象(offlineのままになる)は、
>> >> 片側ノードをリブートした場合だけで発生し、
>> >> 片側ノードのHeartbeatをstop/startしても
>> >> 両ノードをリブートしても発生しません。(onlineになります。)
>> >>
>> >>
>> >>以上、よろしくお願いします。
>> > 
>> > _______________________________________________
>> > Linux-ha-japan mailing list
>> > Linux****@lists*****
>> > http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
>> 
>> --------------------------------------------------
>> NECエンジニアリング
>> MB(事)ソフトウェア部
>> 峠 裕一郎
>> 
>> _______________________________________________
>> Linux-ha-japan mailing list
>> Linux****@lists*****
>> http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan
>> 
> 
> _______________________________________________
> Linux-ha-japan mailing list
> Linux****@lists*****
> http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan

--------------------------------------------------
NECエンジニアリング
MB(事)ソフトウェア部
峠 裕一郎





Linux-ha-japan メーリングリストの案内
Back to archive index