<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">
<html>
<head>

<meta http-equiv="content-type" content="text/html; charset=ISO-8859-1">
</head>
<body text="#000000" bgcolor="#ffffff">
Good afternoon,<br>
I'm trying to form my first cluster of two nodes, using iLO fence
devices. I need some help because I can't find what I've missed. <br>
My main problem is that the "service cman start" reboots the other node
and I can't form the two nodes cluster.<br>
I'm using (at both nodea and nodeb, they are on the same VLAN and pings
each other ok):<br>
<br>
<small><font face="Courier New, Courier, monospace">[root@nodea ~]#
uname -a<br>
Linux nodea 2.6.18-164.15.1.el5 #1 SMP Wed Mar 17 11:30:06 EDT 2010
x86_64 x86_64 x86_64 GNU/Linux</font></small><br>
<small><font face="Courier New, Courier, monospace">[root@nodea ~]# rpm
-qa |grep cman<br>
cman-2.0.115-1.el5_4.9</font></small><br>
<br>
<small><font face="Courier New, Courier, monospace">[root@nodea ~]# cat
/etc/cluster/cluster.conf </font>(nodeb has the same file)<font
 face="Courier New, Courier, monospace"><br>
<?xml version="1.0" ?><br>
<cluster alias="VCluster" config_version="5" name="VCluster"><br>
    <fence_daemon post_fail_delay="0" post_join_delay="25"/><br>
    <clusternodes><br>
        <clusternode name="nodea" nodeid="1" votes="1"><br>
            <fence><br>
                <method name="1"><br>
                    <device name="nodeaILO"/><br>
                </method><br>
            </fence><br>
        </clusternode><br>
        <clusternode name="nodeb" nodeid="2" votes="1"><br>
            <fence><br>
                <method name="1"><br>
                    <device name="nodebILO"/><br>
                </method><br>
            </fence><br>
        </clusternode><br>
    </clusternodes><br>
    <cman expected_votes="1" two_node="1"/><br>
    <fencedevices><br>
        <fencedevice agent="fence_ilo" hostname="nodeacn"
login="user" name="nodeaILO" passwd="hp"/><br>
        <fencedevice agent="fence_ilo" hostname="nodebcn"
login="user" name="nodebILO" passwd="hp"/><br>
    </fencedevices><br>
    <rm><br>
        <failoverdomains/><br>
        <resources/><br>
    </rm><br>
</cluster></font></small><br>
<br>
When I start the cman service, it hangs up for some time at the
"Starting fencing..." step and after those configured 25secs it fences
nodeb and reboots it.<br>
<small><font face="Courier New, Courier, monospace">[root@nodea ~]#
service cman start<br>
Starting cluster: <br>
   Loading modules... done<br>
   Mounting configfs... done<br>
   Starting ccsd... done<br>
   Starting cman... done<br>
   Starting daemons... done<br>
   Starting fencing... done<br>
                                                           [  OK  ]</font></small><br>
<br>
"nodeb" gets rebooted:<br>
<small><font face="Courier New, Courier, monospace">[root@nodeb ~]# <br>
Broadcast message from root (Thu Apr 15 18:42:24 2010):<br>
<br>
The system is going down for system halt NOW!</font></small><br>
<br>
At the syslog I just can find:<br>
<small><font face="Courier New, Courier, monospace">Apr 15 18:40:59
nodea ccsd[16930]: Initial status:: Quorate <br>
Apr 15 18:40:59 nodea openais[16936]: [CLM  ] Members Left: <br>
Apr 15 18:40:59 nodea openais[16936]: [CLM  ] Members Joined: <br>
Apr 15 18:40:59 nodea openais[16936]: [CLM  ] CLM CONFIGURATION CHANGE <br>
Apr 15 18:41:00 nodea openais[16936]: [CLM  ] New Configuration: <br>
Apr 15 18:41:00 nodea openais[16936]: [CLM  ]     r(0)
ip(10.192.16.42)  <br>
Apr 15 18:41:00 nodea openais[16936]: [CLM  ] Members Left: <br>
Apr 15 18:41:00 nodea openais[16936]: [CLM  ] Members Joined: <br>
Apr 15 18:41:00 nodea openais[16936]: [CLM  ]     r(0)
ip(10.192.16.42)  <br>
Apr 15 18:41:00 nodea openais[16936]: [SYNC ] This node is within the
primary component and will provide service. <br>
Apr 15 18:41:00 nodea openais[16936]: [TOTEM] entering OPERATIONAL
state. <br>
Apr 15 18:41:00 nodea openais[16936]: [CMAN ] quorum regained, resuming
activity <br>
Apr 15 18:41:00 nodea openais[16936]: [CLM  ] got nodejoin message
10.192.16.42 <br>
Apr 15 18:42:11 nodea fenced[16955]: nodeb not a cluster member after
25 sec post_join_delay<br>
Apr 15 18:42:11 nodea fenced[16955]: fencing node "nodeb"<br>
Apr 15 18:42:23 nodea fenced[16955]: fence "nodeb" success<br>
</font></small><br>
<small><font face="Courier New, Courier, monospace">[root@nodea ~]#
clustat<br>
Cluster Status for VCluster @ Thu Apr 15 18:55:23 2010<br>
Member Status: Quorate<br>
<br>
 Member Name                                                     ID  
Status<br>
 ------ ----                                                     ----
------<br>
 nodea                                                               1
Online, Local<br>
 nodeb                                                               2
Offline</font></small><br>
<br>
Then when nodeb starts again, I try to start cman there to join the
cluster... but it again fences "nodea":<br>
<small><font face="Courier New, Courier, monospace">[root@nodeb ~]#
clustat<br>
Could not connect to CMAN: No such file or directory<br>
[root@nodeb ~]# service cman start<br>
Starting cluster: <br>
   Loading modules... done<br>
   Mounting configfs... done<br>
   Starting ccsd... done<br>
   Starting cman... done<br>
   Starting qdiskd... done<br>
   Starting daemons... done<br>
   Starting fencing...</font></small> (wait for 25secs again)<small><font
 face="Courier New, Courier, monospace"> done<br>
                                                           [  OK  ]</font></small><br>
"nodea" gets rebooted:<br>
<small><font face="Courier New, Courier, monospace">[root@nodea ~]# <br>
Broadcast message from root (Thu Apr 15 18:58:40 2010):<br>
<br>
The system is going down for system halt NOW!</font></small><br>
<br>
<small><font face="Courier New, Courier, monospace">Apr 15 18:57:31
nodeb openais[11789]: [CLM  ] Members Joined: <br>
Apr 15 18:57:31 nodeb openais[11789]: [CLM  ]     r(0)
ip(10.192.16.44)  <br>
Apr 15 18:57:31 nodeb openais[11789]: [SYNC ] This node is within the
primary component and will provide service. <br>
Apr 15 18:57:31 nodeb openais[11789]: [TOTEM] entering OPERATIONAL
state. <br>
Apr 15 18:57:31 nodeb openais[11789]: [CMAN ] quorum regained, resuming
activity <br>
Apr 15 18:57:31 nodeb openais[11789]: [CLM  ] got nodejoin message
10.192.16.44 <br>
Apr 15 18:57:34 nodeb qdiskd[10323]: <info> Quorum Daemon
Initializing <br>
Apr 15 18:57:34 nodeb qdiskd[10323]: <crit> Initialization failed
<br>
Apr 15 18:58:42 nodeb fenced[11816]: nodea not a cluster member after
25 sec post_join_delay<br>
Apr 15 18:58:42 nodeb fenced[11816]: fencing node "nodea"<br>
Apr 15 18:58:54 nodeb fenced[11816]: fence "nodea" success</font></small><br>
<br>
And I can't get the two nodes, joining the cluster...<br>
I guess I'm missing something at the cluster.conf file??? I can't find
what I'm making wrong.<br>
<br>
Thanks for any help!<br>
<br>
Alex Re<br>
</body>
</html>