[Linux-ha-jp] pg-rex初期構築エラー

Back to archive index

yasusi kojima kojim****@gmail*****
2017年 1月 13日 (金) 17:40:37 JST


松島さん

お世話になっております、小島です。

すみません、先程の頓珍漢な質問は取り下げます。
ありがとうございました。



2017年1月13日 16:48 yasusi kojima <kojim****@gmail*****>:

> 松島さん
>
> お世話になっております、小島です。
>
> ご回答ありがとうございます。
> .pgpass を正しく設定することで起動に成功しました!
> あらぬ方向に目が向いていました。。。
>
> 現在、master/slaveとも構築終了し、VIP経由のDB接続も確認できたところです。
> 早速フェイルオーバーを試みたところmasterは切り替わったのですが、
> 新masterにslave-groupのリソースが残っているのが気になっています。
> これは仕様でしょうか?(VIPcheckで悪さをしなければ構わないのですが)
>
>
>   (1) db001:master db002:slave の状態から
>   (2) db001のPostgreSQLを手動停止し
>   (3) db001:stop   db002:master となった後のcrm_mon実行結果
> ----------------------------------------------------------
> Last updated: Fri Jan 13 15:15:09 2017          Last change: Fri Jan 13
> 15:14:36 2017 by root via crm_attribute on db002
> Stack: corosync
> Current DC: db001 (version 1.1.14-1.el6-70404b0) - partition with quorum
> 2 nodes and 13 resources configured
> Online: [ db001 db002 ]
>  vipCheckMaster (ocf::heartbeat:VIPcheck):      Started db002
>  Resource Group: master-group
>      vip-master (ocf::heartbeat:IPaddr2):       Started db002
>      vip-rep    (ocf::heartbeat:IPaddr2):       Started db002
>  Resource Group: slave-group
>      vipCheckSlave      (ocf::heartbeat:VIPcheck):      Started db002
>      vip-slave  (ocf::heartbeat:IPaddr2):       Started db002
>  Master/Slave Set: msPostgresql [pgsql]
>      Masters: [ db002 ]
>  Clone Set: clnPing [prmPing]
>      Started: [ db001 db002 ]
>  Clone Set: clnDiskd1 [prmDiskd1]
>      Started: [ db001 db002 ]
>  Clone Set: clnDiskd2 [prmDiskd2]
>      Started: [ db001 db002 ]
> Node Attributes:
> * Node db001:
>     + default_ping_set                  : 100
>     + diskcheck_status                  : normal
>     + diskcheck_status_internal         : normal
>     + master-pgsql                      : -INFINITY
>     + pgsql-data-status                 : DISCONNECT
>     + pgsql-status                      : STOP
>     + ringnumber_0                      : 192.168.1.13 is UP
> * Node db002:
>     + default_ping_set                  : 100
>     + diskcheck_status                  : normal
>     + diskcheck_status_internal         : normal
>     + master-pgsql                      : 1000
>     + pgsql-data-status                 : LATEST
>     + pgsql-master-baseline             : 00000001C9000098
>     + pgsql-status                      : PRI
>     + ringnumber_0                      : 192.168.1.14 is UP
> Migration Summary:
> * Node db001:
>    pgsql: migration-threshold=1 fail-count=1 last-failure='Fri Jan 13
> 15:14:25 2017'
> * Node db002:
> Failed Actions:
> * pgsql_monitor_9000 on db001 'not running' (7): call=58, status=complete,
> exitreason='none',
>     last-rc-change='Fri Jan 13 15:14:25 2017', queued=0ms, exec=0ms
> ----------------------------------------------------------
> 以上、よろしくお願いいたします。
>
>
> 2017年1月13日 8:51 Takehiro Matsushima <takeh****@gmail*****>:
>
> 小島さん
>>
>> はじめまして、松島と申します。
>> 私自身はPG-REXのパッケージを使っていないのですが、気になった点を一つ...
>>
>> > Jan  4 13:59:00 db001 pgsql(pgsql)[24357]: WARNING: Can't get
>> PostgreSQL recovery status. rc=2
>> > Jan  4 13:59:00 db001 pgsql(pgsql)[24357]: WARNING: Connection error
>> (connection to the server went bad and the session was not interactive)
>> occurred while executing the psql command.
>>
>> > Jan  4 13:59:01 db001 lrmd[23943]:   notice: pgsql_start_0:24357:stderr
>> [ Password for user postgres:  ]
>> > Jan  4 13:59:01 db001 lrmd[23943]:   notice: pgsql_start_0:24357:stderr
>> [ psql: fe_sendauth: no password supplied ]
>>
>> .pgpassファイルを作成されているようですが、これが読めていないのだと思います。
>> pgsql RAを使用する場合、.pgpassはpostgresユーザーの$HOMEに置く必要がありますので、以下のコマンドをお試し
>> ください。(Pathはうろ覚えですのでご確認ください)
>> sudo -u postgres cp /root/.pgpass /var/lib/pgsql/
>> restorecon /var/lib/pgsql/.pgpass
>> なお、こちらは両方のノードで行っておく必要があります。
>>
>> // もしくは、pg_hba.confで自分と対向ノードからはtrustにしておくのも動作確認としては良いかと思います。
>> 実践投入はできませんが...
>>
>>
>> > 質問1:
>> > pacemaker起動時にPostgreSQL用RA(?)がrecovery.confを作成し、
>> > PostgreSQLがリカバリー処理を行おうとレプリケーション用VIPに
>> > 接続しようとしてエラーが発生している模様です。
>> > masterにもかかわらずslaveの動作をしようとしていることが問題
>> > だと認識しているのですが正しいでしょうか?
>>
>> pgsql RA(に限らずMaster/SlaveタイプのRA)は、stop->slave->master,
>> master->slave->stopと状態を遷移します。
>> このため、まずslaveで起動してmaster-ipに接続を試みて失敗していますが、これは通常の動きです。
>>
>>
>> 以上、簡単ではございますが、お試しください。
>>
>>
>> 松島
>>
>>
>> 2017年1月12日 19:06 yasusi kojima <kojim****@gmail*****>:
>> >
>> > はじめまして小島と申します。
>> >
>> > DBサーバのHAクラスタ、いわゆるPG-REXを目指しています。(初めてです)
>> > 恐縮ですがご支援のほどよろしくお願いいたします。
>> >
>> > 下記構成で国産クラウド上に構築しようとしていますが
>> > masterの初期起動時(pg-rex_master_start)にPostgreSQLの起動に失敗します。
>> >
>> >   CentOS 6.8
>> >   postgresql 9.5
>> >   pacemaker 1.1.14 (linux-ha-ja-pacemaker RHEL6)
>> >   corosync 2.3.5 (linux-ha-ja-pacemaker RHEL6)
>> >   pg-rex 9.5 (NoSTONITH)
>> >
>> > 詳細は添付ファイル(IP等一部改変)を参照していただきたいのですが、
>> > 以下、気になるログを抜粋します。
>> > --- messages -----------------------------------------------
>> > Jan  4 13:54:05 db001 postgres[24526]: [4-1] 2017-01-04 13:54:05.286 JST
>> > [24526]FATAL:  could not connect to the primary server: could not
>> connect to
>> > server: No route to host
>> > Jan  4 13:54:05 db001 postgres[24526]: [4-2] #011#011Is the server
>> running
>> > on host "192.168.1.102" and accepting
>> > Jan  4 13:54:05 db001 postgres[24526]: [4-3] #011#011TCP/IP connections
>> on
>> > port 5432?
>> > Jan  4 13:54:05 db001 postgres[24526]: [4-4] #011
>> > ------------------------------------------------------------
>> >
>> > --- ha-log -------------------------------------------------
>> > Jan  4 13:54:02 db001 pgsql(pgsql)[24357]: WARNING: Can't get PostgreSQL
>> > recovery status. rc=2
>> > Jan  4 13:54:02 db001 pgsql(pgsql)[24357]: WARNING: Connection error
>> > (connection to the server went bad and the session was not interactive)
>> > occurred while executing the psql command.
>> > ------------------------------------------------------------
>> >
>> > 質問1:
>> > pacemaker起動時にPostgreSQL用RA(?)がrecovery.confを作成し、
>> > PostgreSQLがリカバリー処理を行おうとレプリケーション用VIPに
>> > 接続しようとしてエラーが発生している模様です。
>> > masterにもかかわらずslaveの動作をしようとしていることが問題
>> > だと認識しているのですが正しいでしょうか?
>> > 設定誤りか不整合な状態に陥っていると思うのですが、手詰まり
>> > になっています。
>> > 確認ポイントなど支援していただけると助かります。
>> >
>> > ※
>> > masterのみ(初期起動(pg-rex_master_start)前に)PostgreSQLの
>> > インストールと各種セットアップをしており、データインポート
>> > や簡単な動作確認を行っています。
>> > masterは設定を変えつつ起動停止を試行しています。
>> > recovery.confをoffにして単独でPostgreSQLを起動すると正常に
>> > 起動します。
>> > slaveはDBクラスタもない状態で、pg-rex_slave_start も未実施です。
>> >
>> > 質問2:
>> > CentOS 6.8 + postgresql 9.5 の組み合わせでpg-rexを使う場合は
>> > pg-rex_operation_tools 1.7.1 を利用するのが正しいのですよね?
>> >
>> > ※
>> > pg-rex9.5 は CentOS 7 が前提であることは承知していますが、
>> > 現在 pg-rex95-1.1.1-NoSTONITH-1.tar.gz(1.7.2) をインストールし、
>> > pg-rex_operation_tools-1.7.1.tar.gz に梱包されていた
>> > command-rhel6.pm を command.pm と差し替えて使用しています。
>> > 1.7.2 の修正を取り込みたかったのでこのようにしたのですが
>> > 1.7.1 へ変更する予定です。
>> >
>> > 以上、よろしくお願いいたします。
>> >
>> >
>> > _______________________________________________
>> > Linux-ha-japan mailing list
>> > Linux****@lists*****
>> > http://lists.osdn.me/mailman/listinfo/linux-ha-japan
>> >
>> _______________________________________________
>> Linux-ha-japan mailing list
>> Linux****@lists*****
>> http://lists.osdn.me/mailman/listinfo/linux-ha-japan
>>
>
>
-------------- next part --------------
HTML$B$NE:IU%U%!%$%k$rJ]4I$7$^$7$?(B...
다운로드 



Linux-ha-japan メーリングリストの案内
Back to archive index