<p>------------------------------</p>
<p>Message: 8<br>Date: Mon, 01 Oct 2007 10:20:51 -0400<br>From: Lon Hohberger <<a href="mailto:lhh@redhat.com">lhh@redhat.com</a>><br>Subject: Re: [Linux-cluster] service can not be relocated<br>To: linux clustering <
<a href="mailto:linux-cluster@redhat.com">linux-cluster@redhat.com</a>><br>Message-ID: <<a href="mailto:1191248451.4477.15.camel@ayanami.boston.devel.redhat.com">1191248451.4477.15.camel@ayanami.boston.devel.redhat.com
</a>><br>Content-Type: text/plain</p>
<div>On Mon, 2007-10-01 at 10:14 -0400, Lon Hohberger wrote:<br>> On Thu, 2007-09-27 at 15:31 +0800, Changer Van wrote:<br>> > Hi all,<br>> ><br>> > Httpd service can not be relocated when I performed the command as
<br>> > follows:<br>> ><br>> > # clusvcadm -r httpd<br>> > Trying to relocate service:httpd...Failure<br>> > service:httpd is now running on node02<br>><br>> Hi, what release are you using?
</div>
<div>RHEL 5 (2.6.18-8el5)</div>
<div>> Right, and are there any logs on node01 indicating why it might not be<br>> started?</div>
<div>No, there aren't.</div>
<div>But service httpd was relocated to node01 while cluster member was specified </div>
<div>like 'clusvcadm -r httpd  -m node01'.</div>
<p>Now the service was on node01.<br>I did a test as follows:</p>
<p>I unplugged network cable of node01 for a while then plugged in again.<br>Service cman was terminated on node02 suddenly,<br>and it could not stop on node02.</p>
<p>logs on node02:<br>node02 openais[2813]: [CLM  ] CLM CONFIGURATION CHANGE <br>node02 openais[2813]: [CLM  ] New Configuration: <br>node02 openais[2813]: [CLM  ]   r(0) ip(<a href="http://192.168.0.221">192.168.0.221</a>
)  <br>node02 openais[2813]: [CLM  ] Members Left: <br>node02 openais[2813]: [CLM  ] Members Joined: <br>node02 openais[2813]: [SYNC ] This node is within the primary component and will provide service. <br>node02 openais[2813]: [CLM  ] CLM CONFIGURATION CHANGE 
<br>node02 openais[2813]: [CLM  ] New Configuration: <br>node02 openais[2813]: [CLM  ]   r(0) ip(<a href="http://192.168.0.219">192.168.0.219</a>)  <br>node02 openais[2813]: [CLM  ]   r(0) ip(<a href="http://192.168.0.221">
192.168.0.221</a>)  <br>node02 openais[2813]: [CLM  ] Members Left: <br>node02 openais[2813]: [CLM  ] Members Joined: <br>node02 openais[2813]: [CLM  ]   r(0) ip(<a href="http://192.168.0.219">192.168.0.219</a>)  <br>node02 openais[2813]: [SYNC ] This node is within the primary component and will provide service. 
<br>node02 openais[2813]: [TOTEM] entering OPERATIONAL state. <br>node02 openais[2813]: [MAIN ] Killing node node01 because it has rejoined the cluster without cman_tool join <br>node02 openais[2813]: [CMAN ] cman killed by node 2 for reason 3 
<br>node02 dlm_controld[2843]: groupd is down, exiting<br>node02 kernel: dlm: closing connection to node 1<br>node02 gfs_controld[2849]: groupd_dispatch error -1 errno 11<br>node02 gfs_controld[2849]: groupd connection died
<br>node02 gfs_controld[2849]: cluster is down, exiting<br>node02 ccsd[2807]: Unable to connect to cluster infrastructure after 30 seconds.<br>node02 ccsd[2807]: Unable to connect to cluster infrastructure after 60 seconds. 
<br>node02 ccsd[2807]: Unable to connect to cluster infrastructure after 90 seconds. <br></p><br clear="all">Any help would be greatly appreciated.<br>-- <br>Regards,<br>Changer