<br><br><div><span class="gmail_quote">On 11/13/07, <b class="gmail_sendername">Christopher Barry</b> <<a href="mailto:christopher.barry@qlogic.com">christopher.barry@qlogic.com</a>> wrote:</span><blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">







<div>


<p><font size="2">Greetings All,<br>
<br>
running RHEL4U5<br>
<br>
I have a bunch of services on my cluster w/ access via redundant<br>
directors.<br>
<br>
I've created a generic service checking script, which I'm specifying in<br>
<a href="http://lvs.cf" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">lvs.cf</a>'s 'send_program' config parameter.<br>
<br>
script is attached to this post. see that for how it works with the<br>
symlinks described below.<br>
<br>
I create symlinks to the script for every service I want to check, with<br>
their name containing the port to hit, as in:<br>
/sbin/lvs-<port>.sh<br>
<br>
so the symlink name to check ssh availability, for instance, is:<br>
/sbin/lvs-22.sh<br>
<br>
The script works fine, and returns the first contiguous block of<br>
[[:alnum:]] text data from the connection attempt for use with the<br>
expect line of <a href="http://lvs.cf" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">lvs.cf</a>.<br>
<br>
<br>
The problem is, when nanny is spawned by pulse, all of the nanny<br>
processes segfault.<br>
<br>
> Nov 13 14:40:44 kop-sds-dir-01 lvs[17740]: create_monitor for ssh_access/kop-sds-01 running as pid 17749<br>
> Nov 13 14:40:44 kop-sds-dir-01 nanny[17749]: making <a href="http://10.32.12.11:22" target="_blank" onclick="return top.js.OpenExtLink(window,event,this)">10.32.12.11:22</a> available<br>
> Nov 13 14:40:44 kop-sds-dir-01 kernel: nanny[17749]: segfault at 000000000000006c rip 000000335e570810 rsp 0000007fbfffe978 error 4<br>
<br>
this occurs almost instantly for every nanny process.<br>
<br>
Can anyone venture a guess as to what is happening?</font></p></div></blockquote><div><br>Try running nanny manually in foreground - see if you get any error messages. RHEL5 nanny (0.8.4) has a bug where it segfaults on printing syslog log messages longer than 80 characters. Could be that. The patch is below. 
<br><br>
<div>*** util.c      2002-04-25 21:19:57.000000000 -0700<br>--- util.new    
2007-10-10 13:27:43.000000000 -0700<br>***************<br>*** 49,55 ****</div>
<div>
<p>    while (1)<br>      {<br>!       ret = vsnprintf (buf, bufLen, format, 
args);<br>        if ((ret > -1) && (ret < bufLen))<br>        
{<br>          break;<br>--- 49,58 ----</p>
<p>    while (1)<br>      {<br>!       va_list try_args;<br>!       
va_copy(try_args, args);<br>!       ret = vsnprintf (buf, bufLen, format, 
try_args);<br>!       va_end(try_args);<br>        if ((ret > -1) && 
(ret < bufLen)) <br>        {<br>          break;<br></p></div>

 </div><br></div><br>