Hi Ben<br>Thanks<br><br>I named this cluster as mysql-server but i have not installed mysql database in their yet<br><br>and both luci and ricci on luci server and node1 is running this version<br><br>luci-0.12.2-12.el5.centos.1<br>
ricci-0.12.2-12.el5.centos.1<br><br><br>do you think this version has problem as well ??<br><br>thanks for your help<br><br><br><br><div class="gmail_quote">On 24 September 2010 15:33, Ben Turner <span dir="ltr"><<a href="mailto:bturner@redhat.com">bturner@redhat.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin: 0pt 0pt 0pt 0.8ex; border-left: 1px solid rgb(204, 204, 204); padding-left: 1ex;">There is an issue with ricci timeouts that was fixed recently:<br>
<br>
<a href="https://bugzilla.redhat.com/show_bug.cgi?id=564490" target="_blank">https://bugzilla.redhat.com/show_bug.cgi?id=564490</a><br>
<br>
I'm not sure but you may be hitting that bug.  Symptoms include: luci isn't able to get the status from the node, timeouts when querying ricci, etc.  The fix should be released with 5.6<br>
<br>
On the mysql service there are some options that you need to set.  Here are all the options available to that agent:<br>
<br>
mysql<br>
Defines a MySQL database server<br>
<br>
Attribute       Description<br>
config_file     Define configuration file<br>
listen_address  Define an IP address for MySQL server. If the address is not given then first IP address from the service is taken.<br>
mysqld_options  Other command-line options for mysqld<br>
name    Name<br>
ref     Reference to existing mysql resource in the resources section.<br>
service_name    Inherit the service name.<br>
shutdown_wait   Wait X seconds for correct end of service shutdown<br>
startup_wait    Wait X seconds for correct end of service startup<br>
__enforce_timeouts      Consider a timeout for operations as fatal.<br>
__failure_expire_time   Amount of time before a failure is forgotten.<br>
__independent_subtree   Treat this and all children as an independent subtree.<br>
__max_failures  Maximum number of failures before returning a failure to a status check.<br>
<br>
If I recall correctly you may need to tweak:<br>
<br>
shutdown_wait   Wait X seconds for correct end of service shutdown<br>
startup_wait    Wait X seconds for correct end of service startup<br>
<br>
There can be problems relocating the DB if it takes too long to start/shutdown.  If you are having problems relocating with luci it may be a good idea to test with:<br>
<br>
# clusvcadm -r <service name> -m <cluster node><br>
<br>
-Ben<br>
<div><div></div><div class="h5"><br>
<br>
<br>
----- "fosiul alam" <<a href="mailto:expertalert@gmail.com">expertalert@gmail.com</a>> wrote:<br>
<br>
> Hi<br>
> I have 4 nodes cluster,<br>
> It was running fine. but today one nodes is giving trouble<br>
><br>
> From luci Gui interface, when i try to relocate service into this node<br>
> and trying to relocate from this nodes to another nodes<br>
><br>
> from luci gui interface, its showing :<br>
><br>
> Unable to retrieve batch 1908047789 status from<br>
> beaver.domain.local:11111: clusvcadm start failed to start httpd1:<br>
> Starting cluster service "httpd1" on node "http1.domain.local" -- You<br>
> will be redirected in 5 seconds.<br>
> also<br>
><br>
> The ricci agent for this node is unresponsive. Node-specific<br>
> information is not available at this time. :<br>
><br>
> but ricci is running on problematic node ,<br>
> ricci 7324 0.0 0.1 58876 2932 ? S<s 14:40 0:00 ricci -u 101<br>
><br>
> there is not any firewall running.<br>
><br>
> iptables -L<br>
> Chain INPUT (policy ACCEPT)<br>
> target prot opt source destination<br>
><br>
> Chain FORWARD (policy ACCEPT)<br>
> target prot opt source destination<br>
><br>
> Chain OUTPUT (policy ACCEPT)<br>
> target prot opt source destination<br>
><br>
> Chain RH-Firewall-1-INPUT (0 references)<br>
> target prot opt source destination<br>
><br>
> port 11111 is runningg<br>
><br>
> netstat -an | grep 11111<br>
> tcp 0 0 <a href="http://0.0.0.0:11111" target="_blank">0.0.0.0:11111</a> 0.0.0.0:* LISTEN<br>
><br>
><br>
> but still ricci is very unstable , and i cant relocate any service on<br>
> this node or i cant relocate any service away from this node.<br>
><br>
> from problematic node if i type this<br>
><br>
> clustat<br>
> Cluster Status for ng1 @ Thu Sep 23 20:24:02 2010<br>
> Member Status: Quorate<br>
><br>
> Member Name ID Status<br>
> ------ ---- ---- ------<br>
> beaver.xxx.local 1 Online, rgmanager ::: luci is running from this<br>
> server<br>
> publicdns1.xxxx.local 2 Online, rgmanager<br>
> http1.xxxx.local 3 Online, Local, rgmanager<br>
> mail01.xxxxx.local 4 Online, rgmanager<br>
><br>
> Service Name Owner (Last) State<br>
> ------- ---- ----- ------ -----<br>
> service:httpd1 mail01.xxxx.local started<br>
> service:mysql-server http1.xxxx.local started ------------------- this<br>
> is the problematic node<br>
> service:public-dns publicdns1.xxxxxx.local started<br>
><br>
> I cant move that service mysql-server from this node or cant relocate<br>
> any service on this node ..<br>
> I am very confused.<br>
><br>
> what shall i do to fix this issue ??<br>
><br>
> thanks for your advise.<br>
><br>
><br>
><br>
><br>
</div></div>> --<br>
> Linux-cluster mailing list<br>
> <a href="mailto:Linux-cluster@redhat.com">Linux-cluster@redhat.com</a><br>
> <a href="https://www.redhat.com/mailman/listinfo/linux-cluster" target="_blank">https://www.redhat.com/mailman/listinfo/linux-cluster</a><br>
<font color="#888888"><br>
--<br>
Linux-cluster mailing list<br>
<a href="mailto:Linux-cluster@redhat.com">Linux-cluster@redhat.com</a><br>
<a href="https://www.redhat.com/mailman/listinfo/linux-cluster" target="_blank">https://www.redhat.com/mailman/listinfo/linux-cluster</a><br>
</font></blockquote></div><br>