<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=iso-8859-1">
<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:x="urn:schemas-microsoft-com:office:excel" xmlns:p="urn:schemas-microsoft-com:office:powerpoint" xmlns:a="urn:schemas-microsoft-com:office:access" xmlns:dt="uuid:C2F41010-65B3-11d1-A29F-00AA00C14882" xmlns:s="uuid:BDC6E3F0-6DA3-11d1-A2A3-00AA00C14882" xmlns:rs="urn:schemas-microsoft-com:rowset" xmlns:z="#RowsetSchema" xmlns:b="urn:schemas-microsoft-com:office:publisher" xmlns:ss="urn:schemas-microsoft-com:office:spreadsheet" xmlns:c="urn:schemas-microsoft-com:office:component:spreadsheet" xmlns:oa="urn:schemas-microsoft-com:office:activation" xmlns:html="http://www.w3.org/TR/REC-html40" xmlns:q="http://schemas.xmlsoap.org/soap/envelope/" xmlns:D="DAV:" xmlns:x2="http://schemas.microsoft.com/office/excel/2003/xml" xmlns:ois="http://schemas.microsoft.com/sharepoint/soap/ois/" xmlns:dir="http://schemas.microsoft.com/sharepoint/soap/directory/" xmlns:ds="http://www.w3.org/2000/09/xmldsig#" xmlns:dsp="http://schemas.microsoft.com/sharepoint/dsp" xmlns:udc="http://schemas.microsoft.com/data/udc" xmlns:xsd="http://www.w3.org/2001/XMLSchema" xmlns:sub="http://schemas.microsoft.com/sharepoint/soap/2002/1/alerts/" xmlns:ec="http://www.w3.org/2001/04/xmlenc#" xmlns:sp="http://schemas.microsoft.com/sharepoint/" xmlns:sps="http://schemas.microsoft.com/sharepoint/soap/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:udcxf="http://schemas.microsoft.com/data/udc/xmlfile" xmlns:wf="http://schemas.microsoft.com/sharepoint/soap/workflow/" xmlns:mver="http://schemas.openxmlformats.org/markup-compatibility/2006" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns:mrels="http://schemas.openxmlformats.org/package/2006/relationships" xmlns:ex12t="http://schemas.microsoft.com/exchange/services/2006/types" xmlns:ex12m="http://schemas.microsoft.com/exchange/services/2006/messages" xmlns:Z="urn:schemas-microsoft-com:" xmlns="http://www.w3.org/TR/REC-html40">

<head>

<meta name=Generator content="Microsoft Word 12 (filtered medium)">
<style>
<!--
 /* Font Definitions */
 @font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:Tahoma;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
 /* Style Definitions */
 p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0cm;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman","serif";}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
span.EmailStyle17
        {mso-style-type:personal-reply;
        font-family:"Calibri","sans-serif";
        color:#1F497D;}
.MsoChpDefault
        {mso-style-type:export-only;}
@page Section1
        {size:612.0pt 792.0pt;
        margin:70.85pt 70.85pt 70.85pt 70.85pt;}
div.Section1
        {page:Section1;}
-->
</style>
<!--[if gte mso 9]><xml>
 <o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
 <o:shapelayout v:ext="edit">
  <o:idmap v:ext="edit" data="1" />
 </o:shapelayout></xml><![endif]-->
</head>

<body lang=IS link=blue vlink=purple>

<div class=Section1>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Hi,<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p> </o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>I‘m having the exact same issue on a RHEL 5.2 system, and have a
open support case with Redhat. When it will be resolved i can post the details
....<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'><o:p> </o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Thanks,<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:11.0pt;font-family:"Calibri","sans-serif";
color:#1F497D'>Finnur<o:p></o:p></span></p>

<div style='border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt 0cm 0cm 0cm'>

<p class=MsoNormal><b><span lang=EN-US style='font-size:10.0pt;font-family:
"Tahoma","sans-serif"'>From:</span></b><span lang=EN-US style='font-size:10.0pt;
font-family:"Tahoma","sans-serif"'> linux-cluster-bounces@redhat.com
[mailto:linux-cluster-bounces@redhat.com] <b>On Behalf Of </b>Jeremy Lyon<br>
<b>Sent:</b> 22. maí 2008 17:04<br>
<b>To:</b> linux clustering<br>
<b>Subject:</b> [Linux-cluster] Cluster starts, but a node won't rejoin after
reboot<o:p></o:p></span></p>

</div>

<p class=MsoNormal><o:p> </o:p></p>

<p class=MsoNormal style='margin-bottom:12.0pt'>Hi,<br>
<br>
I'm running Cluster 2 on RHEL 5.2 (I saw this behavior on 5.1 and updated just
yesterday to see if it fixed it, but no luck) and I'm seeing issues when I
reboot a node.  I tried increasing the post_join_delay to 60 and the totem
token to 25000, but nothing seems to be working.<br>
<br>
During the boot when the cman init script runs, I see openais messages on the
current running node for anywhere between 15 to 30 seconds:<br>
<br>
May 22 11:52:20 lxomp83k openais[3602]: [TOTEM] entering GATHER state from 0.<br>
May 22 11:52:20 lxomp83k openais[3602]: [TOTEM] Creating commit token because I
am the rep.<br>
May 22 11:52:20 lxomp83k openais[3602]: [TOTEM] Saving state aru 89 high seq
received 89<br>
May 22 11:52:20 lxomp83k openais[3602]: [TOTEM] Storing new sequence id for
ring 560<br>
May 22 11:52:20 lxomp83k openais[3602]: [TOTEM] entering COMMIT state.<br>
May 22 11:52:20 lxomp83k openais[3602]: [TOTEM] entering RECOVERY state.<br>
May 22 11:52:20 lxomp83k openais[3602]: [TOTEM] position [0] member <a
href="http://151.117.65.61">151.117.65.61</a>:<br>
May 22 11:52:20 lxomp83k openais[3602]: [TOTEM] previous ring seq 1372 rep <a
href="http://151.117.65.61">151.117.65.61</a><br>
May 22 11:52:20 lxomp83k openais[3602]: [TOTEM] aru 89 high delivered 89
received flag 1<br>
May 22 11:52:20 lxomp83k openais[3602]: [TOTEM] Did not need to originate any
messages in recovery.<br>
May 22 11:52:20 lxomp83k openais[3602]: [TOTEM] Sending initial ORF token<br>
May 22 11:52:20 lxomp83k openais[3602]: [CLM  ] CLM CONFIGURATION CHANGE<br>
May 22 11:52:20 lxomp83k openais[3602]: [CLM  ] New Configuration:<br>
May 22 11:52:20 lxomp83k openais[3602]: [CLM 
]         r(0) ip(<a
href="http://151.117.65.61">151.117.65.61</a>)<br>
May 22 11:52:20 lxomp83k openais[3602]: [CLM  ] Members Left:<br>
May 22 11:52:20 lxomp83k openais[3602]: [CLM  ] Members Joined:<br>
May 22 11:52:20 lxomp83k openais[3602]: [CLM  ] CLM CONFIGURATION CHANGE<br>
May 22 11:52:20 lxomp83k openais[3602]: [CLM  ] New Configuration:<br>
May 22 11:52:20 lxomp83k openais[3602]: [CLM 
]         r(0) ip(<a
href="http://151.117.65.61">151.117.65.61</a>)<br>
May 22 11:52:20 lxomp83k openais[3602]: [CLM  ] Members Left:<br>
May 22 11:52:20 lxomp83k openais[3602]: [CLM  ] Members Joined:<br>
May 22 11:52:20 lxomp83k openais[3602]: [SYNC ] This node is within the primary
component and will provide service.<br>
May 22 11:52:20 lxomp83k openais[3602]: [TOTEM] entering OPERATIONAL state.<br>
May 22 11:52:20 lxomp83k openais[3602]: [CLM  ] got nodejoin message <a
href="http://151.117.65.61">151.117.65.61</a><br>
May 22 11:52:20 lxomp83k openais[3602]: [CPG  ] got joinlist message from
node 1<br>
May 22 11:52:20 lxomp83k openais[3602]: [TOTEM] entering GATHER state from 9.<br>
<br>
That repeats until I finally see this...<br>
<br>
May 22 11:52:26 lxomp83k openais[3602]: [TOTEM] Creating commit token because I
am the rep.<br>
May 22 11:52:26 lxomp83k openais[3602]: [TOTEM] Saving state aru 89 high seq
received 89<br>
May 22 11:52:26 lxomp83k openais[3602]: [TOTEM] Storing new sequence id for
ring 568<br>
May 22 11:52:26 lxomp83k openais[3602]: [TOTEM] entering COMMIT state.<br>
May 22 11:52:26 lxomp83k openais[3602]: [TOTEM] entering RECOVERY state.<br>
May 22 11:52:26 lxomp83k openais[3602]: [TOTEM] position [0] member <a
href="http://151.117.65.61">151.117.65.61</a>:<br>
May 22 11:52:26 lxomp83k openais[3602]: [TOTEM] previous ring seq 1380 rep <a
href="http://151.117.65.61">151.117.65.61</a><br>
May 22 11:52:26 lxomp83k openais[3602]: [TOTEM] aru 89 high delivered 89
received flag 1<br>
May 22 11:52:26 lxomp83k openais[3602]: [TOTEM] position [1] member <a
href="http://151.117.65.62">151.117.65.62</a>:<br>
May 22 11:52:26 lxomp83k openais[3602]: [TOTEM] previous ring seq 1368 rep <a
href="http://151.117.65.62">151.117.65.62</a><br>
May 22 11:52:26 lxomp83k openais[3602]: [TOTEM] aru c high delivered c received
flag 1<br>
May 22 11:52:26 lxomp83k openais[3602]: [TOTEM] Did not need to originate any
messages in recovery.<br>
May 22 11:52:26 lxomp83k openais[3602]: [TOTEM] Sending initial ORF token<br>
May 22 11:52:26 lxomp83k openais[3602]: [CLM  ] CLM CONFIGURATION CHANGE<br>
May 22 11:52:26 lxomp83k openais[3602]: [CLM  ] New Configuration:<br>
May 22 11:52:26 lxomp83k openais[3602]: [CLM 
]         r(0) ip(<a
href="http://151.117.65.61">151.117.65.61</a>)<br>
May 22 11:52:26 lxomp83k openais[3602]: [CLM  ] Members Left:<br>
May 22 11:52:26 lxomp83k openais[3602]: [CLM  ] Members Joined:<br>
May 22 11:52:26 lxomp83k openais[3602]: [CLM  ] CLM CONFIGURATION CHANGE<br>
May 22 11:52:26 lxomp83k openais[3602]: [CLM  ] New Configuration:<br>
May 22 11:52:26 lxomp83k openais[3602]: [CLM 
]         r(0) ip(<a
href="http://151.117.65.61">151.117.65.61</a>)<br>
May 22 11:52:26 lxomp83k openais[3602]: [CLM 
]         r(0) ip(<a
href="http://151.117.65.62">151.117.65.62</a>)<br>
May 22 11:52:26 lxomp83k openais[3602]: [CLM  ] Members Left:<br>
May 22 11:52:26 lxomp83k openais[3602]: [CLM  ] Members Joined:<br>
May 22 11:52:27 lxomp83k openais[3602]: [CLM 
]         r(0) ip(<a
href="http://151.117.65.62">151.117.65.62</a>)<br>
May 22 11:52:27 lxomp83k openais[3602]: [SYNC ] This node is within the primary
component and will provide service.<br>
May 22 11:52:27 lxomp83k openais[3602]: [TOTEM] entering OPERATIONAL state.<br>
May 22 11:52:27 lxomp83k openais[3602]: [MAIN ] Killing node lxomp84k because
it has rejoined the cluster with existing state<br>
<br>
<br>
At this point when the second node comes up, I can login and run service cman
stop and service cman start.  On that start the node joins the cluster
immediately with no issue.<br>
<br>
<br>
[root@lxomp84k ~]# uname -a<br>
Linux lxomp84k 2.6.18-92.el5 #1 SMP Tue Apr 29 13:16:15 EDT 2008 x86_64 x86_64
x86_64 GNU/Linux<br>
[root@lxomp84k ~]# rpm -q cman<br>
cman-2.0.84-2.el5<br>
<br>
<br>
Any suggestions??<br>
<br>
TIA,<br>
Jeremy<o:p></o:p></p>

</div>

</body>

</html>