<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">

<head>
<meta http-equiv=Content-Type content="text/html; charset=us-ascii">
<meta name=Generator content="Microsoft Word 12 (filtered medium)">
<style>
<!--
 /* Font Definitions */
 @font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
 /* Style Definitions */
 p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        margin-bottom:.0001pt;
        font-size:11.0pt;
        font-family:"Calibri","sans-serif";}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
span.EmailStyle17
        {mso-style-type:personal-compose;
        font-family:"Calibri","sans-serif";
        color:windowtext;}
.MsoChpDefault
        {mso-style-type:export-only;}
@page Section1
        {size:8.5in 11.0in;
        margin:1.0in 1.0in 1.0in 1.0in;}
div.Section1
        {page:Section1;}
-->
</style>
<!--[if gte mso 9]><xml>
 <o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
 <o:shapelayout v:ext="edit">
  <o:idmap v:ext="edit" data="1" />
 </o:shapelayout></xml><![endif]-->
</head>

<body lang=EN-US link=blue vlink=purple>

<div class=Section1>

<p class=MsoNormal>Hello,<o:p></o:p></p>

<p class=MsoNormal>I have a four node cluster using fence-scsi and when I
purposely fail any node but the primary (node 1) it seems to always “avert”
fencing.  If I fail the primary node, the cluster correctly fences the
node.<o:p></o:p></p>

<p class=MsoNormal><o:p> </o:p></p>

<p class=MsoNormal>From node1’s ‘group_tool  dump fence’
when I fail node4:<o:p></o:p></p>

<p class=MsoNormal>1255903014 start default 103 members 2 3 1 
<br>
1255903014 do_recovery stop 98 start 103 finish 98
<br>
1255903014 add node 4 to list 1 <br>
1255903014 averting fence of node 192.168.105.16 <br>
1255903014 finish default 103<o:p></o:p></p>

<p class=MsoNormal><o:p> </o:p></p>

<p class=MsoNormal>The node doesn’t get fenced and it retains it’s
scsi registrations.<o:p></o:p></p>

<p class=MsoNormal><o:p> </o:p></p>

<p class=MsoNormal>From the source: <a
href="http://git.fedorahosted.org/git/fence.git?p=fence.git;a=blob;f=fence/fenced/recover.c">http://git.fedorahosted.org/git/fence.git?p=fence.git;a=blob;f=fence/fenced/recover.c</a><o:p></o:p></p>

<p class=MsoNormal><o:p> </o:p></p>

<p class=MsoNormal>It looks like the conditions for failing are:<br>
cpg_member = is_clean_daemon_member(node->nodeid); <br>
ext = is_fenced_external(fd, node->nodeid); <br>
if ((cluster_member && cpg_member) || ext) {
<br>
log_debug("averting fence of node %s " <br>
  "cluster member %d cpg member %d external %d",
<br>
  node->name, cluster_member, cpg_member, ext);<o:p></o:p></p>

<p class=MsoNormal><o:p> </o:p></p>

<p class=MsoNormal>I don’t think either  “is_clean_daemon_member”
or “is_fenced”external” should be true.   Fenced
isn’t started as a clean daemon and is_fenced_external (I believe) means
that the node is fenced externally by another fenced daemon which shouldn’t
be true either. <o:p></o:p></p>

<p class=MsoNormal><o:p> </o:p></p>

<p class=MsoNormal>Any ideas what could be going on here?  Help or
suggestions would be appreciated!<o:p></o:p></p>

<p class=MsoNormal><o:p> </o:p></p>

<p class=MsoNormal>Sincerely,<o:p></o:p></p>

<p class=MsoNormal><span style='color:#1F497D'>David Challoner<o:p></o:p></span></p>

<p class=MsoNormal><o:p> </o:p></p>

</div>

</body>

</html>