<div> </div>
<div>It seems that rgmanager is failing to report because it is busy.  Since I am running 20 to 25 services on each node, perhaps I can increase the poll interval from 30 seconds to one minute in /usr/share/cluster/script.sh.
</div>
<div> </div>
<div>Maybe the cluster suite is not properly configured for so many services on each node.</div>
<div> </div>
<div><actions><br>        <action name="start" timeout="0"/><br>        <action name="stop" timeout="0"/></div>
<p>        <!-- This is just a wrapper for LSB init scripts, so monitor<br>             and status can't have a timeout, nor do they do any extra<br>             work regardless of the depth --><br>        <action name="status" interval="30s" timeout="0"/>
<br>        <action name="monitor" interval="30s" timeout="0"/></p>
<p>        <action name="meta-data" timeout="0"/><br>        <action name="verify-all" timeout="0"/><br>    </actions><br></p>
<div> <br>Do you think that this might help clustat to report?</div>
<div> </div>
<div>Thank you for your help.</div>
<div><br> </div>
<div><span class="gmail_quote">On 4/9/07, <b class="gmail_sendername">David M</b> <<a href="mailto:diggercheer@gmail.com">diggercheer@gmail.com</a>> wrote:</span>
<blockquote class="gmail_quote" style="PADDING-LEFT: 1ex; MARGIN: 0px 0px 0px 0.8ex; BORDER-LEFT: #ccc 1px solid">
<div> </div>
<div>I am running a four node GFS cluster with about 20 services per node.  All four nodes belong to the same failover domain, and they each have a priority of 1.  My shared storage is an iSCSI SAN.</div>
<div> </div>
<div>After rgmanager has been running for a couple of days, clustat produces the following result on all four nodes:</div>
<div>
<p>Timed out waiting for a response from Resource Group Manager<br>Member Status: Quorate</p>
<p>  Member Name                              Status<br>  ------ ----                              ------<br>  node01           Online, rgmanager<br>  node02           Online, Local, rgmanager<br>  node03           Online, rgmanager 
<br>  node04           Online, rgmanager</p>
<p>I also get a time out when I try to determine the status of a particular service with "clustat -s servicename".</p>
<p>All of the services seem to be up and running, but clustat does not work.  Is there something wrong?  Is there a way for me to increase the time out?</p>
<p>clurgmgrd and dlm_recvd seem to be using a lot of CPU cycles on Node02, 40 and 60 percent, respectively. </p>
<p>Thank you for your help.</p></div></blockquote></div>