[Linux-ha-jp] HeartBeat INFOログが大量に出力される事象について

Back to archive index

Keisuke MORI kskmo****@intel*****
2008年 5月 30日 (金) 20:06:22 JST


森と申します。

私はバージョン1の経験があまり無いので外してるかもしれませんが…

このログを見る限り、ping 先のノードが落ちたりあがったりしてるよ
うに見えます。こちらは確認済みでしょうか?

また APL1/eth0 とは、対向ノードでしょうか?
ping 先として表示されるはずのログにもこれが出ているので
何か変な気がするのですが。

差し支えなければ ha.cf も見せていただいたほうがわかりやすいかも
しれません。

以上、あまりお役に立ててませんがご参考になれば。

takashi narita <t.nar****@freeb*****> writes:

> 成田と申します。
>
> 初めての投稿が質問で申し訳ありませんが、宜しくお願い致します。
>
> 現在稼動しているサーバにて下記のログが多発しております。
> 同じログが対向ノードも出力しております。
> ログの内容を見る限りネットワークデバイスのアップダウンを繰り返しているよ
> うに見えますが、
> 実際のネットワークは問題無く稼動しており、監視にも引っかからず問題無く動
> 作しています。
> また本当にネットワークデバイスのdeadを検知していればフェイルオーバを実行
> するはずですが、
> フェイルオーバは実行されません。
>
> 使用しているHeartBeatは1.2.3です。
> 多発はしていないのですが、2.0.4 でも同様の現象を確認しています。
>
> INFOレベルのログなのでとりあえずそのままにしておりますが、
> もし原因を御存知の方や同じ現象に遭遇された方で対処方法を
> ご存知の方がいらっしゃいましたら御教授頂けると助かります。
>
>>Log
>
> May 27 12:56:38 Server11 ipfail[1886]: info: Link Status update: Link
> APL1/eth0 now has status dead
> May 27 12:56:38 Server11 ipfail[1886]: info: Asking other side for ping
> node count.
> May 27 12:56:38 Server11 ipfail[1886]: info: Checking remote count of
> ping nodes.
> May 27 12:56:38 Server11 ipfail[1886]: info: No giveup timer to abort.
> May 27 12:56:45 Server11 heartbeat[1114]: info: Link APL1:eth0 up.
> May 27 12:56:45 Server11 ipfail[1886]: info: Link Status update: Link
> APL1/eth0 now has status up
> May 27 12:57:20 Server11 ipfail[1886]: info: Ping node count is balanced.
> May 27 13:18:43 Server11 ipfail[1886]: info: Ping node count is balanced.
> May 27 13:26:38 Server11 heartbeat[1114]: info: Link APL1:eth0 dead.
> May 27 13:26:38 Server11 ipfail[1886]: info: Link Status update: Link
> APL1/eth0 now has status dead
> May 27 13:26:38 Server11 ipfail[1886]: info: Asking other side for ping
> node count.
> May 27 13:26:38 Server11 ipfail[1886]: info: Checking remote count of
> ping nodes.
> May 27 13:26:38 Server11 ipfail[1886]: info: No giveup timer to abort.
> May 27 13:26:45 Server11 heartbeat[1114]: info: Link APL1:eth0 up.
> May 27 13:26:45 Server11 ipfail[1886]: info: Link Status update: Link
> APL1/eth0 now has status up
> May 27 13:27:17 Server11 ipfail[1886]: info: Ping node count is balanced.
> May 27 13:48:42 Server11 ipfail[1886]: info: Ping node count is balanced.
> May 27 14:00:53 Server11 heartbeat[1114]: info: Link APL1:eth0 dead.
> May 27 14:00:53 Server11 ipfail[1886]: info: Link Status update: Link
> APL1/eth0 now has status dead
> May 27 14:00:53 Server11 ipfail[1886]: info: Asking other side for ping
> node count.
> May 27 14:00:53 Server11 ipfail[1886]: info: Checking remote count of
> ping nodes.
> May 27 14:00:54 Server11 ipfail[1886]: info: No giveup timer to abort.
> May 27 14:01:16 Server11 heartbeat[1114]: info: Link APL1:eth0 up.
> May 27 14:01:16 Server11 ipfail[1886]: info: Link Status update: Link
> APL1/eth0 now has status up
>
> 以上、宜しくお願い致します。
>
> _______________________________________________
> Linux-ha-japan mailing list
> Linux****@lists*****
> http://lists.sourceforge.jp/mailman/listinfo/linux-ha-japan

-- 
Keisuke MORI
Open Source Business Unit
Software Services Integration Business Division
NTT DATA Intellilink Corporation
Tel: +81-3-3534-4810 / Fax: +81-3-3534-4814





Linux-ha-japan メーリングリストの案内
Back to archive index