<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>
  <meta content="text/html; charset=ISO-8859-1"
 http-equiv="Content-Type">
</head>
<body text="#000000" bgcolor="#ffffff">
Good morning,<br>
<br>
thanks for your replies!<br>
Multicast was definetively my problem. I couldn't use a crossed cable
as suggested by Jeff, because these servers are blades, but after
checking/configuring the IGMP properties at the switches ports, the
cluster started working fine!<br>
<br>
Thanks again!<br>
Alex.<br>
<br>
On 04/15/2010 08:34 PM, Jeff Sturm wrote:
<blockquote
 cite="mid:64D0546C5EBBD147B75DE133D798665F055D8F80@hugo.eprize.local"
 type="cite">
  <meta http-equiv="Content-Type"
 content="text/html; charset=ISO-8859-1">
  <meta name="Generator" content="Microsoft Word 12 (filtered medium)">
  <style>
<!--
 /* Font Definitions */
 @font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:Tahoma;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
@font-face
        {font-family:Verdana;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
 /* Style Definitions */
 p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman","serif";}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
tt
        {mso-style-priority:99;
        font-family:"Courier New";}
span.EmailStyle18
        {mso-style-type:personal-reply;
        font-family:"Verdana","sans-serif";
        color:#1F497D;
        font-weight:normal;
        font-style:normal;}
.MsoChpDefault
        {mso-style-type:export-only;}
@page Section1
        {size:8.5in 11.0in;
        margin:1.0in 1.0in 1.0in 1.0in;}
div.Section1
        {page:Section1;}
-->
  </style>
<!--[if gte mso 9]><xml>
 <o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
 <o:shapelayout v:ext="edit">
  <o:idmap v:ext="edit" data="1" />
 </o:shapelayout></xml><![endif]-->
  <div class="Section1">
  <p class="MsoNormal"><span
 style="font-size: 10pt; font-family: "Verdana","sans-serif"; color: rgb(31, 73, 125);">For
two node clusters there's a convenient workaround:  crossover
cable.<o:p></o:p></span></p>
  <p class="MsoNormal"><span
 style="font-size: 10pt; font-family: "Verdana","sans-serif"; color: rgb(31, 73, 125);"><o:p> </o:p></span></p>
  <p class="MsoNormal"><span
 style="font-size: 10pt; font-family: "Verdana","sans-serif"; color: rgb(31, 73, 125);">You'll
need a spare Ethernet port but that's easier than getting
certain switches to do multicast correctly.  (At least in my
experience.)<o:p></o:p></span></p>
  <p class="MsoNormal"><span
 style="font-size: 10pt; font-family: "Verdana","sans-serif"; color: rgb(31, 73, 125);"><o:p> </o:p></span></p>
  <div
 style="border-style: none none none solid; border-color: -moz-use-text-color -moz-use-text-color -moz-use-text-color blue; border-width: medium medium medium 1.5pt; padding: 0in 0in 0in 4pt;">
  <div>
  <div
 style="border-style: solid none none; border-color: rgb(181, 196, 223) -moz-use-text-color -moz-use-text-color; border-width: 1pt medium medium; padding: 3pt 0in 0in;">
  <p class="MsoNormal"><b><span
 style="font-size: 10pt; font-family: "Tahoma","sans-serif";">From:</span></b><span
 style="font-size: 10pt; font-family: "Tahoma","sans-serif";">
<a class="moz-txt-link-abbreviated" href="mailto:linux-cluster-bounces@redhat.com">linux-cluster-bounces@redhat.com</a>
[<a class="moz-txt-link-freetext" href="mailto:linux-cluster-bounces@redhat.com">mailto:linux-cluster-bounces@redhat.com</a>] <b>On
Behalf Of </b><a class="moz-txt-link-abbreviated" href="mailto:Jason_Henderson@Mitel.com">Jason_Henderson@Mitel.com</a><br>
  <b>Sent:</b> Thursday, April 15, 2010 1:44 PM<br>
  <b>To:</b> linux clustering<br>
  <b>Cc:</b> <a class="moz-txt-link-abbreviated" href="mailto:linux-cluster@redhat.com">linux-cluster@redhat.com</a>; <a class="moz-txt-link-abbreviated" href="mailto:linux-cluster-bounces@redhat.com">linux-cluster-bounces@redhat.com</a><br>
  <b>Subject:</b> Re: [Linux-cluster] Two node cluster,start CMAN fence
the other
node<o:p></o:p></span></p>
  </div>
  </div>
  <p class="MsoNormal"><o:p> </o:p></p>
  <p class="MsoNormal"><br>
  <span style="font-size: 10pt; font-family: "Arial","sans-serif";">Most
likely the
multicast packet communication between the 2 nodes is not getting
through your
network.</span> <br>
  <br>
  <tt><span style="font-size: 10pt;"><a class="moz-txt-link-abbreviated" href="mailto:linux-cluster-bounces@redhat.com">linux-cluster-bounces@redhat.com</a>
wrote on
04/15/2010 01:05:01 PM:</span></tt><span
 style="font-size: 10pt; font-family: "Courier New";"><br>
  <br>
  <tt>> Good afternoon,</tt><br>
  <tt>> I'm trying to form my first cluster of two nodes, using iLO
fence </tt><br>
  <tt>> devices. I need some help because I can't find what I've
missed. </tt><br>
  <tt>> My main problem is that the "service cman start" reboots the
other </tt><br>
  <tt>> node and I can't form the two nodes cluster.</tt><br>
  <tt>> I'm using (at both nodea and nodeb, they are on the same
VLAN and </tt><br>
  <tt>> pings each other ok):</tt><br>
  <tt>> </tt><br>
  <tt>> [root@nodea ~]# uname -a</tt><br>
  <tt>> Linux nodea 2.6.18-164.15.1.el5 #1 SMP Wed Mar 17 11:30:06
EDT 2010 </tt><br>
  <tt>> x86_64 x86_64 x86_64 GNU/Linux</tt><br>
  <tt>> [root@nodea ~]# rpm -qa |grep cman</tt><br>
  <tt>> cman-2.0.115-1.el5_4.9</tt><br>
  <tt>> </tt><br>
  <tt>> [root@nodea ~]# cat /etc/cluster/cluster.conf (nodeb has the
same
file)</tt><br>
  <tt>> <?xml version="1.0" ?></tt><br>
  <tt>> <cluster alias="VCluster" config_version="5"
name="VCluster"></tt><br>
  <tt>>     <fence_daemon post_fail_delay="0"
post_join_delay="25"/></tt><br>
  <tt>>     <clusternodes></tt><br>
  <tt>>         <clusternode name="nodea"
nodeid="1" votes="1"></tt><br>
  <tt>>             <fence></tt><br>
  <tt>>                 <method
name="1"></tt><br>
  <tt>>                    
<device name="nodeaILO"/></tt><br>
  <tt>>                
</method></tt><br>
  <tt>>             </fence></tt><br>
  <tt>>         </clusternode></tt><br>
  <tt>>         <clusternode name="nodeb"
nodeid="2" votes="1"></tt><br>
  <tt>>             <fence></tt><br>
  <tt>>                 <method
name="1"></tt><br>
  <tt>>                    
<device name="nodebILO"/></tt><br>
  <tt>>                
</method></tt><br>
  <tt>>             </fence></tt><br>
  <tt>>         </clusternode></tt><br>
  <tt>>     </clusternodes></tt><br>
  <tt>>     <cman expected_votes="1"
two_node="1"/></tt><br>
  <tt>>     <fencedevices></tt><br>
  <tt>>         <fencedevice
agent="fence_ilo" hostname="nodeacn" </tt><br>
  <tt>> login="user" name="nodeaILO"
passwd="hp"/></tt><br>
  <tt>>         <fencedevice
agent="fence_ilo" hostname="nodebcn" </tt><br>
  <tt>> login="user" name="nodebILO"
passwd="hp"/></tt><br>
  <tt>>     </fencedevices></tt><br>
  <tt>>     <rm></tt><br>
  <tt>>         <failoverdomains/></tt><br>
  <tt>>         <resources/></tt><br>
  <tt>>     </rm></tt><br>
  <tt>> </cluster></tt><br>
  <tt>> </tt><br>
  <tt>> When I start the cman service, it hangs up for some time at
the </tt><br>
  <tt>> "Starting fencing..." step and after those configured 25secs
it </tt><br>
  <tt>> fences nodeb and reboots it.</tt><br>
  <tt>> [root@nodea ~]# service cman start</tt><br>
  <tt>> Starting cluster: </tt><br>
  <tt>>    Loading modules... done</tt><br>
  <tt>>    Mounting configfs... done</tt><br>
  <tt>>    Starting ccsd... done</tt><br>
  <tt>>    Starting cman... done</tt><br>
  <tt>>    Starting daemons... done</tt><br>
  <tt>>    Starting fencing... done</tt><br>
  <tt>>                    
                     
                 [  OK
 ]</tt><br>
  <tt>> </tt><br>
  <tt>> "nodeb" gets rebooted:</tt><br>
  <tt>> [root@nodeb ~]# </tt><br>
  <tt>> Broadcast message from root (Thu Apr 15 18:42:24 2010):</tt><br>
  <tt>> </tt><br>
  <tt>> The system is going down for system halt NOW!</tt><br>
  <tt>> </tt><br>
  <tt>> At the syslog I just can find:</tt><br>
  <tt>> Apr 15 18:40:59 nodea ccsd[16930]: Initial status:: Quorate </tt><br>
  <tt>> Apr 15 18:40:59 nodea openais[16936]: [CLM  ] Members Left: </tt><br>
  <tt>> Apr 15 18:40:59 nodea openais[16936]: [CLM  ] Members
Joined: </tt><br>
  <tt>> Apr 15 18:40:59 nodea openais[16936]: [CLM  ] CLM
CONFIGURATION
CHANGE </tt><br>
  <tt>> Apr 15 18:41:00 nodea openais[16936]: [CLM  ] New
Configuration: </tt><br>
  <tt>> Apr 15 18:41:00 nodea openais[16936]: [CLM  ]     r(0)
ip(10.192.16.42)  </tt><br>
  <tt>> Apr 15 18:41:00 nodea openais[16936]: [CLM  ] Members Left: </tt><br>
  <tt>> Apr 15 18:41:00 nodea openais[16936]: [CLM  ] Members
Joined: </tt><br>
  <tt>> Apr 15 18:41:00 nodea openais[16936]: [CLM  ]     r(0)
ip(10.192.16.42)  </tt><br>
  <tt>> Apr 15 18:41:00 nodea openais[16936]: [SYNC ] This node is
within </tt><br>
  <tt>> the primary component and will provide service. </tt><br>
  <tt>> Apr 15 18:41:00 nodea openais[16936]: [TOTEM] entering
OPERATIONAL
state. </tt><br>
  <tt>> Apr 15 18:41:00 nodea openais[16936]: [CMAN ] quorum
regained, </tt><br>
  <tt>> resuming activity </tt><br>
  <tt>> Apr 15 18:41:00 nodea openais[16936]: [CLM  ] got nodejoin
message </tt><br>
  <tt>> 10.192.16.42 </tt><br>
  <tt>> Apr 15 18:42:11 nodea fenced[16955]: nodeb not a cluster
member </tt><br>
  <tt>> after 25 sec post_join_delay</tt><br>
  <tt>> Apr 15 18:42:11 nodea fenced[16955]: fencing node "nodeb"</tt><br>
  <tt>> Apr 15 18:42:23 nodea fenced[16955]: fence "nodeb" success</tt><br>
  <tt>> </tt><br>
  <tt>> [root@nodea ~]# clustat</tt><br>
  <tt>> Cluster Status for VCluster @ Thu Apr 15 18:55:23 2010</tt><br>
  <tt>> Member Status: Quorate</tt><br>
  <tt>> </tt><br>
  <tt>>  Member Name              
                     
                ID   Status</tt><br>
  <tt>>  ------ ----              
                     
                ---- ------</tt><br>
  <tt>>  nodea                
                     
                     
 </tt><br>
  <tt>> 1 Online, Local</tt><br>
  <tt>>  nodeb                
                     
                     
 2 Offline</tt><br>
  <tt>> </tt><br>
  <tt>> Then when nodeb starts again, I try to start cman there to
join the </tt><br>
  <tt>> cluster... but it again fences "nodea":</tt><br>
  <tt>> [root@nodeb ~]# clustat</tt><br>
  <tt>> Could not connect to CMAN: No such file or directory</tt><br>
  <tt>> [root@nodeb ~]# service cman start</tt><br>
  <tt>> Starting cluster: </tt><br>
  <tt>>    Loading modules... done</tt><br>
  <tt>>    Mounting configfs... done</tt><br>
  <tt>>    Starting ccsd... done</tt><br>
  <tt>>    Starting cman... done</tt><br>
  <tt>>    Starting qdiskd... done</tt><br>
  <tt>>    Starting daemons... done</tt><br>
  <tt>>    Starting fencing... (wait for 25secs again) done</tt><br>
  <tt>>                    
                     
                 [  OK
 ]</tt><br>
  <tt>> "nodea" gets rebooted:</tt><br>
  <tt>> [root@nodea ~]# </tt><br>
  <tt>> Broadcast message from root (Thu Apr 15 18:58:40 2010):</tt><br>
  <tt>> </tt><br>
  <tt>> The system is going down for system halt NOW!</tt><br>
  <tt>> </tt><br>
  <tt>> Apr 15 18:57:31 nodeb openais[11789]: [CLM  ] Members
Joined: </tt><br>
  <tt>> Apr 15 18:57:31 nodeb openais[11789]: [CLM  ]     r(0)
ip(10.192.16.44)  </tt><br>
  <tt>> Apr 15 18:57:31 nodeb openais[11789]: [SYNC ] This node is
within </tt><br>
  <tt>> the primary component and will provide service. </tt><br>
  <tt>> Apr 15 18:57:31 nodeb openais[11789]: [TOTEM] entering
OPERATIONAL
state. </tt><br>
  <tt>> Apr 15 18:57:31 nodeb openais[11789]: [CMAN ] quorum
regained, </tt><br>
  <tt>> resuming activity </tt><br>
  <tt>> Apr 15 18:57:31 nodeb openais[11789]: [CLM  ] got nodejoin
message </tt><br>
  <tt>> 10.192.16.44 </tt><br>
  <tt>> Apr 15 18:57:34 nodeb qdiskd[10323]: <info> Quorum
Daemon
Initializing </tt><br>
  <tt>> Apr 15 18:57:34 nodeb qdiskd[10323]: <crit>
Initialization
failed </tt><br>
  <tt>> Apr 15 18:58:42 nodeb fenced[11816]: nodea not a cluster
member </tt><br>
  <tt>> after 25 sec post_join_delay</tt><br>
  <tt>> Apr 15 18:58:42 nodeb fenced[11816]: fencing node "nodea"</tt><br>
  <tt>> Apr 15 18:58:54 nodeb fenced[11816]: fence "nodea" success</tt><br>
  <tt>> </tt><br>
  <tt>> And I can't get the two nodes, joining the cluster...</tt><br>
  <tt>> I guess I'm missing something at the cluster.conf file??? I
can't </tt><br>
  <tt>> find what I'm making wrong.</tt><br>
  <tt>> </tt><br>
  <tt>> Thanks for any help!</tt><br>
  <tt>> </tt><br>
  <tt>> Alex Re--</tt><br>
  <tt>> Linux-cluster mailing list</tt><br>
  <tt>> <a class="moz-txt-link-abbreviated" href="mailto:Linux-cluster@redhat.com">Linux-cluster@redhat.com</a></tt><br>
  <tt>> <a class="moz-txt-link-freetext" href="https://www.redhat.com/mailman/listinfo/linux-cluster">https://www.redhat.com/mailman/listinfo/linux-cluster</a></tt></span><o:p></o:p></p>
  </div>
  </div>
  <pre wrap="">
<fieldset class="mimeAttachmentHeader"></fieldset>
--
Linux-cluster mailing list
<a class="moz-txt-link-abbreviated" href="mailto:Linux-cluster@redhat.com">Linux-cluster@redhat.com</a>
<a class="moz-txt-link-freetext" href="https://www.redhat.com/mailman/listinfo/linux-cluster">https://www.redhat.com/mailman/listinfo/linux-cluster</a></pre>
</blockquote>
</body>
</html>