<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">

<head>
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=us-ascii">
<meta name=Generator content="Microsoft Word 12 (filtered medium)">
<style>
<!--
 /* Font Definitions */
 @font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:Tahoma;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
@font-face
        {font-family:Verdana;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
 /* Style Definitions */
 p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman","serif";}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
tt
        {mso-style-priority:99;
        font-family:"Courier New";}
span.EmailStyle18
        {mso-style-type:personal-reply;
        font-family:"Verdana","sans-serif";
        color:#1F497D;
        font-weight:normal;
        font-style:normal;}
.MsoChpDefault
        {mso-style-type:export-only;}
@page Section1
        {size:8.5in 11.0in;
        margin:1.0in 1.0in 1.0in 1.0in;}
div.Section1
        {page:Section1;}
-->
</style>
<!--[if gte mso 9]><xml>
 <o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
 <o:shapelayout v:ext="edit">
  <o:idmap v:ext="edit" data="1" />
 </o:shapelayout></xml><![endif]-->
</head>

<body lang=EN-US link=blue vlink=purple>

<div class=Section1>

<p class=MsoNormal><span style='font-size:10.0pt;font-family:"Verdana","sans-serif";
color:#1F497D'>For two node clusters there's a convenient workaround:  crossover
cable.<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:10.0pt;font-family:"Verdana","sans-serif";
color:#1F497D'><o:p> </o:p></span></p>

<p class=MsoNormal><span style='font-size:10.0pt;font-family:"Verdana","sans-serif";
color:#1F497D'>You'll need a spare Ethernet port but that's easier than getting
certain switches to do multicast correctly.  (At least in my experience.)<o:p></o:p></span></p>

<p class=MsoNormal><span style='font-size:10.0pt;font-family:"Verdana","sans-serif";
color:#1F497D'><o:p> </o:p></span></p>

<div style='border:none;border-left:solid blue 1.5pt;padding:0in 0in 0in 4.0pt'>

<div>

<div style='border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt 0in 0in 0in'>

<p class=MsoNormal><b><span style='font-size:10.0pt;font-family:"Tahoma","sans-serif"'>From:</span></b><span
style='font-size:10.0pt;font-family:"Tahoma","sans-serif"'>
linux-cluster-bounces@redhat.com [mailto:linux-cluster-bounces@redhat.com] <b>On
Behalf Of </b>Jason_Henderson@Mitel.com<br>
<b>Sent:</b> Thursday, April 15, 2010 1:44 PM<br>
<b>To:</b> linux clustering<br>
<b>Cc:</b> linux-cluster@redhat.com; linux-cluster-bounces@redhat.com<br>
<b>Subject:</b> Re: [Linux-cluster] Two node cluster,start CMAN fence the other
node<o:p></o:p></span></p>

</div>

</div>

<p class=MsoNormal><o:p> </o:p></p>

<p class=MsoNormal><br>
<span style='font-size:10.0pt;font-family:"Arial","sans-serif"'>Most likely the
multicast packet communication between the 2 nodes is not getting through your
network.</span> <br>
<br>
<tt><span style='font-size:10.0pt'>linux-cluster-bounces@redhat.com wrote on
04/15/2010 01:05:01 PM:</span></tt><span style='font-size:10.0pt;font-family:
"Courier New"'><br>
<br>
<tt>> Good afternoon,</tt><br>
<tt>> I'm trying to form my first cluster of two nodes, using iLO fence </tt><br>
<tt>> devices. I need some help because I can't find what I've missed. </tt><br>
<tt>> My main problem is that the "service cman start" reboots the
other </tt><br>
<tt>> node and I can't form the two nodes cluster.</tt><br>
<tt>> I'm using (at both nodea and nodeb, they are on the same VLAN and </tt><br>
<tt>> pings each other ok):</tt><br>
<tt>> </tt><br>
<tt>> [root@nodea ~]# uname -a</tt><br>
<tt>> Linux nodea 2.6.18-164.15.1.el5 #1 SMP Wed Mar 17 11:30:06 EDT 2010 </tt><br>
<tt>> x86_64 x86_64 x86_64 GNU/Linux</tt><br>
<tt>> [root@nodea ~]# rpm -qa |grep cman</tt><br>
<tt>> cman-2.0.115-1.el5_4.9</tt><br>
<tt>> </tt><br>
<tt>> [root@nodea ~]# cat /etc/cluster/cluster.conf (nodeb has the same
file)</tt><br>
<tt>> <?xml version="1.0" ?></tt><br>
<tt>> <cluster alias="VCluster" config_version="5"
name="VCluster"></tt><br>
<tt>>     <fence_daemon post_fail_delay="0"
post_join_delay="25"/></tt><br>
<tt>>     <clusternodes></tt><br>
<tt>>         <clusternode name="nodea"
nodeid="1" votes="1"></tt><br>
<tt>>             <fence></tt><br>
<tt>>                 <method
name="1"></tt><br>
<tt>>                    
<device name="nodeaILO"/></tt><br>
<tt>>                
</method></tt><br>
<tt>>             </fence></tt><br>
<tt>>         </clusternode></tt><br>
<tt>>         <clusternode name="nodeb"
nodeid="2" votes="1"></tt><br>
<tt>>             <fence></tt><br>
<tt>>                 <method
name="1"></tt><br>
<tt>>                    
<device name="nodebILO"/></tt><br>
<tt>>                
</method></tt><br>
<tt>>             </fence></tt><br>
<tt>>         </clusternode></tt><br>
<tt>>     </clusternodes></tt><br>
<tt>>     <cman expected_votes="1"
two_node="1"/></tt><br>
<tt>>     <fencedevices></tt><br>
<tt>>         <fencedevice
agent="fence_ilo" hostname="nodeacn" </tt><br>
<tt>> login="user" name="nodeaILO"
passwd="hp"/></tt><br>
<tt>>         <fencedevice
agent="fence_ilo" hostname="nodebcn" </tt><br>
<tt>> login="user" name="nodebILO"
passwd="hp"/></tt><br>
<tt>>     </fencedevices></tt><br>
<tt>>     <rm></tt><br>
<tt>>         <failoverdomains/></tt><br>
<tt>>         <resources/></tt><br>
<tt>>     </rm></tt><br>
<tt>> </cluster></tt><br>
<tt>> </tt><br>
<tt>> When I start the cman service, it hangs up for some time at the </tt><br>
<tt>> "Starting fencing..." step and after those configured 25secs
it </tt><br>
<tt>> fences nodeb and reboots it.</tt><br>
<tt>> [root@nodea ~]# service cman start</tt><br>
<tt>> Starting cluster: </tt><br>
<tt>>    Loading modules... done</tt><br>
<tt>>    Mounting configfs... done</tt><br>
<tt>>    Starting ccsd... done</tt><br>
<tt>>    Starting cman... done</tt><br>
<tt>>    Starting daemons... done</tt><br>
<tt>>    Starting fencing... done</tt><br>
<tt>>                    
                     
                 [  OK
 ]</tt><br>
<tt>> </tt><br>
<tt>> "nodeb" gets rebooted:</tt><br>
<tt>> [root@nodeb ~]# </tt><br>
<tt>> Broadcast message from root (Thu Apr 15 18:42:24 2010):</tt><br>
<tt>> </tt><br>
<tt>> The system is going down for system halt NOW!</tt><br>
<tt>> </tt><br>
<tt>> At the syslog I just can find:</tt><br>
<tt>> Apr 15 18:40:59 nodea ccsd[16930]: Initial status:: Quorate </tt><br>
<tt>> Apr 15 18:40:59 nodea openais[16936]: [CLM  ] Members Left: </tt><br>
<tt>> Apr 15 18:40:59 nodea openais[16936]: [CLM  ] Members Joined: </tt><br>
<tt>> Apr 15 18:40:59 nodea openais[16936]: [CLM  ] CLM CONFIGURATION
CHANGE </tt><br>
<tt>> Apr 15 18:41:00 nodea openais[16936]: [CLM  ] New Configuration: </tt><br>
<tt>> Apr 15 18:41:00 nodea openais[16936]: [CLM  ]     r(0)
ip(10.192.16.42)  </tt><br>
<tt>> Apr 15 18:41:00 nodea openais[16936]: [CLM  ] Members Left: </tt><br>
<tt>> Apr 15 18:41:00 nodea openais[16936]: [CLM  ] Members Joined: </tt><br>
<tt>> Apr 15 18:41:00 nodea openais[16936]: [CLM  ]     r(0)
ip(10.192.16.42)  </tt><br>
<tt>> Apr 15 18:41:00 nodea openais[16936]: [SYNC ] This node is within </tt><br>
<tt>> the primary component and will provide service. </tt><br>
<tt>> Apr 15 18:41:00 nodea openais[16936]: [TOTEM] entering OPERATIONAL
state. </tt><br>
<tt>> Apr 15 18:41:00 nodea openais[16936]: [CMAN ] quorum regained, </tt><br>
<tt>> resuming activity </tt><br>
<tt>> Apr 15 18:41:00 nodea openais[16936]: [CLM  ] got nodejoin
message </tt><br>
<tt>> 10.192.16.42 </tt><br>
<tt>> Apr 15 18:42:11 nodea fenced[16955]: nodeb not a cluster member </tt><br>
<tt>> after 25 sec post_join_delay</tt><br>
<tt>> Apr 15 18:42:11 nodea fenced[16955]: fencing node "nodeb"</tt><br>
<tt>> Apr 15 18:42:23 nodea fenced[16955]: fence "nodeb" success</tt><br>
<tt>> </tt><br>
<tt>> [root@nodea ~]# clustat</tt><br>
<tt>> Cluster Status for VCluster @ Thu Apr 15 18:55:23 2010</tt><br>
<tt>> Member Status: Quorate</tt><br>
<tt>> </tt><br>
<tt>>  Member Name              
                     
                ID   Status</tt><br>
<tt>>  ------ ----              
                     
                ---- ------</tt><br>
<tt>>  nodea                
                     
                     
 </tt><br>
<tt>> 1 Online, Local</tt><br>
<tt>>  nodeb                
                     
                     
 2 Offline</tt><br>
<tt>> </tt><br>
<tt>> Then when nodeb starts again, I try to start cman there to join the </tt><br>
<tt>> cluster... but it again fences "nodea":</tt><br>
<tt>> [root@nodeb ~]# clustat</tt><br>
<tt>> Could not connect to CMAN: No such file or directory</tt><br>
<tt>> [root@nodeb ~]# service cman start</tt><br>
<tt>> Starting cluster: </tt><br>
<tt>>    Loading modules... done</tt><br>
<tt>>    Mounting configfs... done</tt><br>
<tt>>    Starting ccsd... done</tt><br>
<tt>>    Starting cman... done</tt><br>
<tt>>    Starting qdiskd... done</tt><br>
<tt>>    Starting daemons... done</tt><br>
<tt>>    Starting fencing... (wait for 25secs again) done</tt><br>
<tt>>                    
                     
                 [  OK
 ]</tt><br>
<tt>> "nodea" gets rebooted:</tt><br>
<tt>> [root@nodea ~]# </tt><br>
<tt>> Broadcast message from root (Thu Apr 15 18:58:40 2010):</tt><br>
<tt>> </tt><br>
<tt>> The system is going down for system halt NOW!</tt><br>
<tt>> </tt><br>
<tt>> Apr 15 18:57:31 nodeb openais[11789]: [CLM  ] Members Joined: </tt><br>
<tt>> Apr 15 18:57:31 nodeb openais[11789]: [CLM  ]     r(0)
ip(10.192.16.44)  </tt><br>
<tt>> Apr 15 18:57:31 nodeb openais[11789]: [SYNC ] This node is within </tt><br>
<tt>> the primary component and will provide service. </tt><br>
<tt>> Apr 15 18:57:31 nodeb openais[11789]: [TOTEM] entering OPERATIONAL
state. </tt><br>
<tt>> Apr 15 18:57:31 nodeb openais[11789]: [CMAN ] quorum regained, </tt><br>
<tt>> resuming activity </tt><br>
<tt>> Apr 15 18:57:31 nodeb openais[11789]: [CLM  ] got nodejoin
message </tt><br>
<tt>> 10.192.16.44 </tt><br>
<tt>> Apr 15 18:57:34 nodeb qdiskd[10323]: <info> Quorum Daemon
Initializing </tt><br>
<tt>> Apr 15 18:57:34 nodeb qdiskd[10323]: <crit> Initialization
failed </tt><br>
<tt>> Apr 15 18:58:42 nodeb fenced[11816]: nodea not a cluster member </tt><br>
<tt>> after 25 sec post_join_delay</tt><br>
<tt>> Apr 15 18:58:42 nodeb fenced[11816]: fencing node "nodea"</tt><br>
<tt>> Apr 15 18:58:54 nodeb fenced[11816]: fence "nodea" success</tt><br>
<tt>> </tt><br>
<tt>> And I can't get the two nodes, joining the cluster...</tt><br>
<tt>> I guess I'm missing something at the cluster.conf file??? I can't </tt><br>
<tt>> find what I'm making wrong.</tt><br>
<tt>> </tt><br>
<tt>> Thanks for any help!</tt><br>
<tt>> </tt><br>
<tt>> Alex Re--</tt><br>
<tt>> Linux-cluster mailing list</tt><br>
<tt>> Linux-cluster@redhat.com</tt><br>
<tt>> https://www.redhat.com/mailman/listinfo/linux-cluster</tt></span><o:p></o:p></p>

</div>

</div>

</body>

</html>