yasusi kojima
kojim****@gmail*****
2017年 1月 13日 (金) 17:40:37 JST
松島さん お世話になっております、小島です。 すみません、先程の頓珍漢な質問は取り下げます。 ありがとうございました。 2017年1月13日 16:48 yasusi kojima <kojim****@gmail*****>: > 松島さん > > お世話になっております、小島です。 > > ご回答ありがとうございます。 > .pgpass を正しく設定することで起動に成功しました! > あらぬ方向に目が向いていました。。。 > > 現在、master/slaveとも構築終了し、VIP経由のDB接続も確認できたところです。 > 早速フェイルオーバーを試みたところmasterは切り替わったのですが、 > 新masterにslave-groupのリソースが残っているのが気になっています。 > これは仕様でしょうか?(VIPcheckで悪さをしなければ構わないのですが) > > > (1) db001:master db002:slave の状態から > (2) db001のPostgreSQLを手動停止し > (3) db001:stop db002:master となった後のcrm_mon実行結果 > ---------------------------------------------------------- > Last updated: Fri Jan 13 15:15:09 2017 Last change: Fri Jan 13 > 15:14:36 2017 by root via crm_attribute on db002 > Stack: corosync > Current DC: db001 (version 1.1.14-1.el6-70404b0) - partition with quorum > 2 nodes and 13 resources configured > Online: [ db001 db002 ] > vipCheckMaster (ocf::heartbeat:VIPcheck): Started db002 > Resource Group: master-group > vip-master (ocf::heartbeat:IPaddr2): Started db002 > vip-rep (ocf::heartbeat:IPaddr2): Started db002 > Resource Group: slave-group > vipCheckSlave (ocf::heartbeat:VIPcheck): Started db002 > vip-slave (ocf::heartbeat:IPaddr2): Started db002 > Master/Slave Set: msPostgresql [pgsql] > Masters: [ db002 ] > Clone Set: clnPing [prmPing] > Started: [ db001 db002 ] > Clone Set: clnDiskd1 [prmDiskd1] > Started: [ db001 db002 ] > Clone Set: clnDiskd2 [prmDiskd2] > Started: [ db001 db002 ] > Node Attributes: > * Node db001: > + default_ping_set : 100 > + diskcheck_status : normal > + diskcheck_status_internal : normal > + master-pgsql : -INFINITY > + pgsql-data-status : DISCONNECT > + pgsql-status : STOP > + ringnumber_0 : 192.168.1.13 is UP > * Node db002: > + default_ping_set : 100 > + diskcheck_status : normal > + diskcheck_status_internal : normal > + master-pgsql : 1000 > + pgsql-data-status : LATEST > + pgsql-master-baseline : 00000001C9000098 > + pgsql-status : PRI > + ringnumber_0 : 192.168.1.14 is UP > Migration Summary: > * Node db001: > pgsql: migration-threshold=1 fail-count=1 last-failure='Fri Jan 13 > 15:14:25 2017' > * Node db002: > Failed Actions: > * pgsql_monitor_9000 on db001 'not running' (7): call=58, status=complete, > exitreason='none', > last-rc-change='Fri Jan 13 15:14:25 2017', queued=0ms, exec=0ms > ---------------------------------------------------------- > 以上、よろしくお願いいたします。 > > > 2017年1月13日 8:51 Takehiro Matsushima <takeh****@gmail*****>: > > 小島さん >> >> はじめまして、松島と申します。 >> 私自身はPG-REXのパッケージを使っていないのですが、気になった点を一つ... >> >> > Jan 4 13:59:00 db001 pgsql(pgsql)[24357]: WARNING: Can't get >> PostgreSQL recovery status. rc=2 >> > Jan 4 13:59:00 db001 pgsql(pgsql)[24357]: WARNING: Connection error >> (connection to the server went bad and the session was not interactive) >> occurred while executing the psql command. >> >> > Jan 4 13:59:01 db001 lrmd[23943]: notice: pgsql_start_0:24357:stderr >> [ Password for user postgres: ] >> > Jan 4 13:59:01 db001 lrmd[23943]: notice: pgsql_start_0:24357:stderr >> [ psql: fe_sendauth: no password supplied ] >> >> .pgpassファイルを作成されているようですが、これが読めていないのだと思います。 >> pgsql RAを使用する場合、.pgpassはpostgresユーザーの$HOMEに置く必要がありますので、以下のコマンドをお試し >> ください。(Pathはうろ覚えですのでご確認ください) >> sudo -u postgres cp /root/.pgpass /var/lib/pgsql/ >> restorecon /var/lib/pgsql/.pgpass >> なお、こちらは両方のノードで行っておく必要があります。 >> >> // もしくは、pg_hba.confで自分と対向ノードからはtrustにしておくのも動作確認としては良いかと思います。 >> 実践投入はできませんが... >> >> >> > 質問1: >> > pacemaker起動時にPostgreSQL用RA(?)がrecovery.confを作成し、 >> > PostgreSQLがリカバリー処理を行おうとレプリケーション用VIPに >> > 接続しようとしてエラーが発生している模様です。 >> > masterにもかかわらずslaveの動作をしようとしていることが問題 >> > だと認識しているのですが正しいでしょうか? >> >> pgsql RA(に限らずMaster/SlaveタイプのRA)は、stop->slave->master, >> master->slave->stopと状態を遷移します。 >> このため、まずslaveで起動してmaster-ipに接続を試みて失敗していますが、これは通常の動きです。 >> >> >> 以上、簡単ではございますが、お試しください。 >> >> >> 松島 >> >> >> 2017年1月12日 19:06 yasusi kojima <kojim****@gmail*****>: >> > >> > はじめまして小島と申します。 >> > >> > DBサーバのHAクラスタ、いわゆるPG-REXを目指しています。(初めてです) >> > 恐縮ですがご支援のほどよろしくお願いいたします。 >> > >> > 下記構成で国産クラウド上に構築しようとしていますが >> > masterの初期起動時(pg-rex_master_start)にPostgreSQLの起動に失敗します。 >> > >> > CentOS 6.8 >> > postgresql 9.5 >> > pacemaker 1.1.14 (linux-ha-ja-pacemaker RHEL6) >> > corosync 2.3.5 (linux-ha-ja-pacemaker RHEL6) >> > pg-rex 9.5 (NoSTONITH) >> > >> > 詳細は添付ファイル(IP等一部改変)を参照していただきたいのですが、 >> > 以下、気になるログを抜粋します。 >> > --- messages ----------------------------------------------- >> > Jan 4 13:54:05 db001 postgres[24526]: [4-1] 2017-01-04 13:54:05.286 JST >> > [24526]FATAL: could not connect to the primary server: could not >> connect to >> > server: No route to host >> > Jan 4 13:54:05 db001 postgres[24526]: [4-2] #011#011Is the server >> running >> > on host "192.168.1.102" and accepting >> > Jan 4 13:54:05 db001 postgres[24526]: [4-3] #011#011TCP/IP connections >> on >> > port 5432? >> > Jan 4 13:54:05 db001 postgres[24526]: [4-4] #011 >> > ------------------------------------------------------------ >> > >> > --- ha-log ------------------------------------------------- >> > Jan 4 13:54:02 db001 pgsql(pgsql)[24357]: WARNING: Can't get PostgreSQL >> > recovery status. rc=2 >> > Jan 4 13:54:02 db001 pgsql(pgsql)[24357]: WARNING: Connection error >> > (connection to the server went bad and the session was not interactive) >> > occurred while executing the psql command. >> > ------------------------------------------------------------ >> > >> > 質問1: >> > pacemaker起動時にPostgreSQL用RA(?)がrecovery.confを作成し、 >> > PostgreSQLがリカバリー処理を行おうとレプリケーション用VIPに >> > 接続しようとしてエラーが発生している模様です。 >> > masterにもかかわらずslaveの動作をしようとしていることが問題 >> > だと認識しているのですが正しいでしょうか? >> > 設定誤りか不整合な状態に陥っていると思うのですが、手詰まり >> > になっています。 >> > 確認ポイントなど支援していただけると助かります。 >> > >> > ※ >> > masterのみ(初期起動(pg-rex_master_start)前に)PostgreSQLの >> > インストールと各種セットアップをしており、データインポート >> > や簡単な動作確認を行っています。 >> > masterは設定を変えつつ起動停止を試行しています。 >> > recovery.confをoffにして単独でPostgreSQLを起動すると正常に >> > 起動します。 >> > slaveはDBクラスタもない状態で、pg-rex_slave_start も未実施です。 >> > >> > 質問2: >> > CentOS 6.8 + postgresql 9.5 の組み合わせでpg-rexを使う場合は >> > pg-rex_operation_tools 1.7.1 を利用するのが正しいのですよね? >> > >> > ※ >> > pg-rex9.5 は CentOS 7 が前提であることは承知していますが、 >> > 現在 pg-rex95-1.1.1-NoSTONITH-1.tar.gz(1.7.2) をインストールし、 >> > pg-rex_operation_tools-1.7.1.tar.gz に梱包されていた >> > command-rhel6.pm を command.pm と差し替えて使用しています。 >> > 1.7.2 の修正を取り込みたかったのでこのようにしたのですが >> > 1.7.1 へ変更する予定です。 >> > >> > 以上、よろしくお願いいたします。 >> > >> > >> > _______________________________________________ >> > Linux-ha-japan mailing list >> > Linux****@lists***** >> > http://lists.osdn.me/mailman/listinfo/linux-ha-japan >> > >> _______________________________________________ >> Linux-ha-japan mailing list >> Linux****@lists***** >> http://lists.osdn.me/mailman/listinfo/linux-ha-japan >> > > -------------- next part -------------- HTML$B$NE:IU%U%!%$%k$rJ]4I$7$^$7$?(B... 다운로드