<br><br><div class="gmail_quote">On Mon, Jun 15, 2009 at 4:17 PM, Moralejo, Alfredo <span dir="ltr"><<a href="mailto:alfredo.moralejo@roche.com">alfredo.moralejo@roche.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">













<div link="blue" vlink="purple" lang="EN-US">

<div>

<p><font face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial;">Hi,</span></font></p>

<p><font face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial;"> </span></font></p>

<p><font face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial;">I’m having what I think is a timeouts issue in my
cluster.</span></font></p>

<p><font face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial;"> </span></font></p>

<p><font face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial;">I have a two node cluster using qdisk. Everytime the node
that has the master role for qdisk becomes down (for failure or even stopping
qdiskd manually), packages in the sane node are stopped because of the lack of
quorum as the qdiskd becames unresponsive until second node becames master node
and start working properly. Once qdiskd start working fine (usually 5-6 seconds)
packages are started again. </span></font></p>

<p><font face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial;"> </span></font></p>

<p><font face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial;">I’ve read in the cluster manual section for “</span></font><font face="LiberationSans-Regular" size="2"><span style="font-size: 10pt; font-family: LiberationSans-Regular;">CMAN membership timeout value” and I think this
is the case. I’ve used RHEL 5.3 and I thought this parameter is the token
that I set much longer that needed:</span></font></p>

<p><font face="LiberationSans-Regular" size="2"><span style="font-size: 10pt; font-family: LiberationSans-Regular;"> </span></font></p>

<p><font face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial;"><cluster alias="CLUSTER_ENG"
config_version="75" name="CLUSTER_ENG"></span></font></p>

<p><font face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial;">        <totem token="50000"/></span></font></p>

<p><font face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial;">…</span></font></p>

<p><font face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial;"> </span></font></p>

<p><font face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial;">        <quorumd
device="/dev/mapper/mpathquorump1" interval="3"
status_file="/tmp/qdisk" tko="3" votes="5"
log_level="7" log_facility="local4"/></span></font></p>

<p><font face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial;"> </span></font></p>

<p><font face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial;"> </span></font></p>

<p><font face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial;">Totem token is much more that double of qdisk timeout, so I
guess it should be enough but everytime qdisk dies in the master node I get
same result, services restarted in the sane node:</span></font></p>

<p><font face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial;"> </span></font></p>

<p><font face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial;">Jun 15 16:11:33 rmamseslab07 qdiskd[14130]: <debug>
Node 1 missed an update (2/3)</span></font></p>

<p><font face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial;">Jun 15 16:11:38 rmamseslab07 qdiskd[14130]: <debug>
Node 1 missed an update (3/3)</span></font></p>

<p><font face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial;">Jun 15 16:11:43 rmamseslab07 qdiskd[14130]: <debug>
Node 1 missed an update (4/3)</span></font></p>

<p><font face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial;">Jun 15 16:11:43 rmamseslab07 qdiskd[14130]: <debug>
Node 1 DOWN</span></font></p>

<p><font face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial;">Jun 15 16:11:43 rmamseslab07 qdiskd[14130]: <debug>
Making bid for master</span></font></p>

<p><font face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial;">Jun 15 16:11:44 rmamseslab07 clurgmgrd: [18510]:
<info> Executing /etc/init.d/watchdog status</span></font></p>

<p><font face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial;">Jun 15 16:11:48 rmamseslab07 qdiskd[14130]: <debug>
Node 1 missed an update (5/3)</span></font></p>

<p><font face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial;">Jun 15 16:11:53 rmamseslab07 qdiskd[14130]: <debug>
Node 1 missed an update (6/3)</span></font></p>

<p><b><font color="red" face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial; color: red; font-weight: bold;">Jun 15 16:11:53
rmamseslab07 qdiskd[14130]: <info> Assuming master role</span></font></b></p>

<p><font color="red" face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial; color: red;"> </span></font></p>

<p><font color="red" face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial; color: red;">Message from syslogd@rmamseslab07 at Jun 15
16:11:53 ...</span></font></p>

<p><font color="red" face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial; color: red;"> clurgmgrd[18510]: <emerg> #1: Quorum
Dissolved</span></font></p>

<p><font color="red" face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial; color: red;">Jun 15 16:11:53 rmamseslab07
openais[14087]: [CMAN ] lost contact with quorum device</span></font></p>

<p><font color="red" face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial; color: red;">Jun 15 16:11:53 rmamseslab07
openais[14087]: [CMAN ] quorum lost, blocking activity</span></font></p>

<p><font color="red" face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial; color: red;">Jun 15 16:11:53 rmamseslab07 clurgmgrd[18510]:
<debug> Membership Change Event</span></font></p>

<p><b><font color="red" face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial; color: red; font-weight: bold;">Jun 15 16:11:53
rmamseslab07 clurgmgrd[18510]: <emerg> #1: Quorum Dissolved</span></font></b></p>

<p><font color="red" face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial; color: red;">Jun 15 16:11:53 rmamseslab07
clurgmgrd[18510]: <debug> Emergency stop of service:Cluster_test_2</span></font></p>

<p><font color="red" face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial; color: red;">Jun 15 16:11:53 rmamseslab07 clurgmgrd[18510]:
<debug> Emergency stop of service:wdtcscript-rmamseslab05-ic</span></font></p>

<p><font color="red" face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial; color: red;">Jun 15 16:11:53 rmamseslab07
clurgmgrd[18510]: <debug> Emergency stop of
service:wdtcscript-rmamseslab07-ic</span></font></p>

<p><font color="red" face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial; color: red;">Jun 15 16:11:54 rmamseslab07
clurgmgrd[18510]: <debug> Emergency stop of service:Logical volume 1</span></font></p>

<p><font face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial;">Jun 15 16:11:58 rmamseslab07 qdiskd[14130]: <debug>
Node 1 missed an update (7/3)</span></font></p>

<p><font face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial;">Jun 15 16:11:58 rmamseslab07 qdiskd[14130]: <notice>
Writing eviction notice for node 1</span></font></p>

<p><font face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial;">Jun 15 16:11:58 rmamseslab07 qdiskd[14130]: <debug>
Telling CMAN to kill the node</span></font></p>

<p><b><font color="red" face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial; color: red; font-weight: bold;">Jun 15 16:11:58
rmamseslab07 openais[14087]: [CMAN ] quorum regained, resuming activity</span></font></b></p>

<p><font face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial;"> </span></font></p>

<p><font face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial;">I’ve just logged a case but… any idea????</span></font></p>

<p><font face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial;"> </span></font></p>

<p><font face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial;">Regards,</span></font></p>

<p><font face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial;"></span></font></p></div></div></blockquote><div>Hi!<br><br>Have you set two_node="0" in cman section?<br>Why don't you use any heuristics within the quorumd configuration? I.e: pinging a router...<br>
Could you paste us your cluster.conf?<br><br>Greetings,<br>Juanra<br> </div><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;"><div link="blue" vlink="purple" lang="EN-US">
<div><p><font face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial;"> </span></font></p>

<p><font face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial;"> </span></font></p>

<p><b><font face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial; font-weight: bold;">Alfredo Moralejo</span></font></b> <br>
<font face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial;">Business
Platforms Engineering - OS Servers - UNIX Senior Specialist</span></font></p>

<p><font face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial;" lang="DE">F. Hoffmann-La Roche Ltd.</span></font><span lang="DE"></span></p>

<p><font face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial;">Global Informatics Group Infrastructure<br>
Josefa Valcárcel, 40<br>
28027 Madrid SPAIN</span></font></p>

<p><font face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial;" lang="EN-GB">Phone: +34 91 305 97 87</span></font><span lang="EN-GB"> </span></p>

<p><font face="Times New Roman" size="3"><span style="font-size: 12pt;"><a href="mailto:alfredo.moralejo@roche.com" target="_blank"><font face="Arial" size="2"><span style="font-size: 10pt; font-family: Arial;" lang="EN-GB">alfredo.moralejo@roche.com</span></font></a>
</span></font></p>

<p><b><font face="Arial" size="1"><span style="font-size: 7.5pt; font-family: Arial; font-weight: bold;" lang="EN-GB">Confidentiality Note:</span></font></b><font face="Arial" size="1"><span style="font-size: 7.5pt; font-family: Arial;" lang="EN-GB">
This message is intended only for the use of the named recipient(s) and may
contain confidential and/or proprietary information. If you are not the
intended recipient, please contact the sender and delete this message. Any
unauthorized use of the information contained in this message is prohibited. </span></font></p>

<p><font face="Times New Roman" size="3"><span style="font-size: 12pt;"> </span></font></p>

</div>

</div>


<br>--<br>
Linux-cluster mailing list<br>
<a href="mailto:Linux-cluster@redhat.com">Linux-cluster@redhat.com</a><br>
<a href="https://www.redhat.com/mailman/listinfo/linux-cluster" target="_blank">https://www.redhat.com/mailman/listinfo/linux-cluster</a><br></blockquote></div><br>