<br><font size=2 face="sans-serif">See below;</font>
<br>
<br><font size=2 face="sans-serif">Gary Romo<br>
IBM Global Technology Services<br>
303.458.4415<br>
Email: garromo@us.ibm.com<br>
Pager:1.877.552.9264<br>
Text message: gromo@skytel.com</font>
<br>
<br>
<br>
<table width=100%>
<tr valign=top>
<td width=40%><font size=1 face="sans-serif"><b>jim parsons <jparsons@redhat.com></b>
</font>
<br><font size=1 face="sans-serif">Sent by: linux-cluster-bounces@redhat.com</font>
<p><font size=1 face="sans-serif">01/17/2008 03:40 PM</font>
<table border>
<tr valign=top>
<td bgcolor=white>
<div align=center><font size=1 face="sans-serif">Please respond to<br>
linux clustering <linux-cluster@redhat.com></font></div></table>
<br>
<td width=59%>
<table width=100%>
<tr valign=top>
<td>
<div align=right><font size=1 face="sans-serif">To</font></div>
<td><font size=1 face="sans-serif">linux clustering <linux-cluster@redhat.com></font>
<tr valign=top>
<td>
<div align=right><font size=1 face="sans-serif">cc</font></div>
<td><font size=1 face="sans-serif">linux-cluster-bounces@redhat.com</font>
<tr valign=top>
<td>
<div align=right><font size=1 face="sans-serif">Subject</font></div>
<td><font size=1 face="sans-serif">Re: [Linux-cluster] BladeCenter Fencing
errors</font></table>
<br>
<table>
<tr valign=top>
<td>
<td></table>
<br></table>
<br>
<br>
<br><tt><font size=2>On Thu, 2008-01-17 at 14:06 -0700, Gary Romo wrote:<br>
> <br>
> I enabled telnet on the MM, now I am getting these messsages; <br>
> <br>
> Jan 17 14:00:24 node1 fenced[3229]: fence "node2" failed
<br>
> Jan 17 14:00:29 node1 fenced[3229]: fencing node "node2"
<br>
> Jan 17 14:00:40 node1 fenced[3229]: agent "fence_bladecenter"
reports:<br>
> pattern match timed-out at /sbin/fence_bladecenter line 189  <br>
> <br>
> Jan 17 14:00:40 node1 fenced[3229]: fence "node2" failed
<br>
> Jan 17 14:00:45 node1 fenced[3229]: fencing node "node2"
<br>
> Jan 17 14:00:56 node1 fenced[3229]: agent "fence_bladecenter"
reports:<br>
> pattern match timed-out at /sbin/fence_bladecenter line 189  <br>
> <br>
> Jan 17 14:00:56 node1 fenced[3229]: fence "node2" failed
<br>
> Jan 17 14:01:01 node1 fenced[3229]: fencing node "node2"
<br>
> Jan 17 14:01:12 node1 fenced[3229]: agent "fence_bladecenter"
reports:<br>
> pattern match timed-out at /sbin/fence_bladecenter line 189  <br>
> <br>
> Line 189 looks like this; <br>
> <br>
>  ($text, $match) = $t->waitfor("/system:blade\\[$bladenum\\]>/");
<br>
> <br>
> <br>
> I am getting these on thesecond node; <br>
> <br>
> Jan 17 14:03:24 mode2 fenced[3340]: fence "node1" failed
<br>
> Jan 17 14:03:29 node2 fenced[3340]: fencing node "node1"
<br>
> Jan 17 14:03:29 node2 fenced[3340]: fence "node1" failed
<br>
> Jan 17 14:03:34 node2 fenced[3340]: fencing node "node1"
<br>
> Jan 17 14:03:34 node2 fenced[3340]: fence "node1" failed
<br>
> <br>
Ah, yuck. Well, let's figure out what is going on here.<br>
Can you post the clusternodes and fencedevices sections of your<br>
cluster.conf here? Just XXXX out any passwords.</font></tt>
<br>
<br><font size=2 face="Courier New"><b><?xml version="1.0"?></b></font>
<br><font size=2 face="Courier New"><b><cluster alias="rhcs-1-clus"
config_version="4" name="rhcs-1-clus"></b></font>
<br><font size=2 face="Courier New"><b>        <fence_daemon
post_fail_delay="0" post_join_delay="3"/></b></font>
<br><font size=2 face="Courier New"><b>        <clusternodes></b></font>
<br><font size=2 face="Courier New"><b>         
      <clusternode name="node1" votes="1"></b></font>
<br><font size=2 face="Courier New"><b>         
              <multicast addr="XXX.XXX.127.204"
interface="eth0"/></b></font>
<br><font size=2 face="Courier New"><b>         
              <fence></b></font>
<br><font size=2 face="Courier New"><b>         
                     
<method name="1"></b></font>
<br><font size=2 face="Courier New"><b>         
                     
        <device blade="2" name="chassis_fence"/></b></font>
<br><font size=2 face="Courier New"><b>         
                     
</method></b></font>
<br><font size=2 face="Courier New"><b>         
              </fence></b></font>
<br><font size=2 face="Courier New"><b>         
      </clusternode></b></font>
<br><font size=2 face="Courier New"><b>         
      <clusternode name="node2" votes="1"></b></font>
<br><font size=2 face="Courier New"><b>         
              <multicast addr="XXX.XXX.127.204"
interface="eth0"/></b></font>
<br><font size=2 face="Courier New"><b>         
              <fence></b></font>
<br><font size=2 face="Courier New"><b>         
                     
<method name="1"></b></font>
<br><font size=2 face="Courier New"><b>         
                     
        <device blade="3" name="chassis_fence"/></b></font>
<br><font size=2 face="Courier New"><b>         
                     
</method></b></font>
<br><font size=2 face="Courier New"><b>         
              </fence></b></font>
<br><font size=2 face="Courier New"><b>         
      </clusternode></b></font>
<br><font size=2 face="Courier New"><b>        </clusternodes></b></font>
<br><tt><font size=2>        <b><cman expected_votes="1"
two_node="1"></b></font></tt>
<br><tt><font size=2><b>             
  <multicast addr="XXX.XXX.127.204"/></b></font></tt>
<br><tt><font size=2><b>        </cman></b></font></tt>
<br><tt><font size=2><b>        <fencedevices></b></font></tt>
<br><tt><font size=2><b>             
  <fencedevice agent="fence_bladecenter" ipaddr="XXX.XXX.1.143"
login="rchs_fence" name="chassis_fence" passwd="XXXXXXX"/></b></font></tt>
<br><tt><font size=2><b>        </fencedevices></b><br>
<br>
On one of the cluster nodes, can you run <br>
'/sbin/fence_bladecenter -a <ip or hostname of bladecenter> -l <login><br>
-p <passwd> -n <blade number of another running node> -o status
-v'</font></tt>
<br>
<br><font size=2 face="Courier New"><b>[root@lxdnt648 ~]# /sbin/fence_bladecenter
-a chassis -l rchs_fence -p XXXXXXX -n 2 -o status -v</b></font>
<br><font size=2 face="Courier New"><b>Please use '-h' for usage.</b></font><tt><font size=2><br>
<br>
Do you know firmware details about your bladecenter? The<br>
fence_bladecenter script hasn't changed in years...The tested firmware<br>
versions are in the top of the file. Maybe the interface has changed. If<br>
so, the debuglog should give us information.</font></tt>
<br>
<br>
<table border=4 width=100%>
<tr>
<td width=5%><font size=2 face="Arial"> 1  </font>
<td width=14%><font size=2 face="Arial">  chassis  </font>
<td width=22%><font size=2 face="Arial">  Main application  </font>
<td width=16%><font size=2 face="Arial">  BRET85M  </font>
<td width=23%><font size=2 face="Arial">  CNETMNUS.PKT  </font>
<td width=13%><font size=2 face="Arial">  01-10-07  </font>
<td width=4%>
<div align=center><font size=2 face="Arial">16</font></div>
<tr>
<td><font size=2 face="Arial">     </font>
<td><font size=2 face="Arial">     </font>
<td><font size=2 face="Arial">  Boot ROM<sup>*</sup>  </font>
<td><font size=2 face="Arial">  BRBR82A  </font>
<td><font size=2 face="Arial">  CNETBRUS.PKT  </font>
<td><font size=2 face="Arial">  06-01-05  </font>
<td>
<div align=center><font size=2 face="Arial">16</font></div>
<tr>
<td><font size=2 face="Arial">     </font>
<td><font size=2 face="Arial">     </font>
<td><font size=2 face="Arial">  Remote control  </font>
<td><font size=2 face="Arial">  BRRG85M  </font>
<td><font size=2 face="Arial">  CNETRGUS.PKT  </font>
<td><font size=2 face="Arial">  01-10-07  </font>
<td>
<div align=center><font size=2 face="Arial">16</font></div></table>
<br><tt><font size=2><br>
<br>
This will get us started.<br>
<br>
-Jim<br>
<br>
--<br>
Linux-cluster mailing list<br>
Linux-cluster@redhat.com<br>
https://www.redhat.com/mailman/listinfo/linux-cluster<br>
</font></tt>
<br>