Hi,<div><br></div><div>This servers is on VMware? At the same host?</div><div>SElinux is disable? iptables have something?</div><div><br></div><div>In my environment I had a problem to start GFS2 with servers in differents hosts.</div>
<div>To clustering servers, was need migrate one server to the same host of the other, and restart this.</div><div><br></div><div>I think, one of the problem was because the virtual switchs.</div><div>To solve, I changed a multicast IP, to use 225.0.0.13 at cluster.conf </div>
<div>  <multicast addr="225.0.0.13"/></div><div>And add a static route in both, to use default gateway.</div><div><br></div><div>I don't know if it's correct, but this solve my problem.</div><div><br>
</div><div>I hope that help you.</div><div><br></div><div>Regards.</div><div><br><div class="gmail_quote">On Fri, Jan 6, 2012 at 5:01 PM, Wes Modes <span dir="ltr"><<a href="mailto:wmodes@ucsc.edu">wmodes@ucsc.edu</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hi, Steven.<br>
<br>
I've tried just about every possible combination of hostname and<br>
cluster.conf.<br>
<br>
ping to test01 resolves to 128.114.31.112<br>
ping to <a href="http://test01.gdao.ucsc.edu" target="_blank">test01.gdao.ucsc.edu</a> resolves to 128.114.31.112<br>
<br>
It feels like the right thing is being returned.  This feels like it<br>
might be a quirk (or bug possibly) of cman or openais.<br>
<br>
There are some old bug reports around this, for example<br>
<a href="https://bugzilla.redhat.com/show_bug.cgi?id=488565" target="_blank">https://bugzilla.redhat.com/show_bug.cgi?id=488565</a>.  It sounds like the<br>
way that cman reports this error is anything but straightforward.<br>
<br>
Is there anyone who has encountered this error and found a solution?<br>
<span class="HOEnZb"><font color="#888888"><br>
Wes<br>
</font></span><div class="HOEnZb"><div class="h5"><br>
<br>
On 1/6/2012 2:00 AM, Steven Whitehouse wrote:<br>
> Hi,<br>
><br>
> On Thu, 2012-01-05 at 13:54 -0800, Wes Modes wrote:<br>
>> Howdy, y'all. I'm trying to set up GFS in a cluster on CentOS systems<br>
>> running on vmWare. The GFS FS is on a Dell Equilogic SAN.<br>
>><br>
>> I keep running into the same problem despite many differently-flavored<br>
>> attempts to set up GFS. The problem comes when I try to start cman, the<br>
>> cluster management software.<br>
>><br>
>>     [root@test01]# service cman start<br>
>>     Starting cluster:<br>
>>        Loading modules... done<br>
>>        Mounting configfs... done<br>
>>        Starting ccsd... done<br>
>>        Starting cman... failed<br>
>>     cman not started: Can't find local node name in cluster.conf<br>
>> /usr/sbin/cman_tool: aisexec daemon didn't start<br>
>>                                                                [FAILED]<br>
>><br>
> This looks like what it says... whatever the node name is in<br>
> cluster.conf, it doesn't exist when the name is looked up, or possibly<br>
> it does exist, but is mapped to the loopback address (it needs to map to<br>
> an address which is valid cluster-wide)<br>
><br>
> Since your config files look correct, the next thing to check is what<br>
> the resolver is actually returning. Try (for example) a ping to test01<br>
> (you need to specify exactly the same form of the name as is used in<br>
> cluster.conf) from test02 and see whether it uses the correct ip<br>
> address, just in case the wrong thing is being returned.<br>
><br>
> Steve.<br>
><br>
>>     [root@test01]# tail /var/log/messages<br>
>>     Jan  5 13:39:40 testbench06 ccsd[13194]: Unable to connect to<br>
>> cluster infrastructure after 1193640 seconds.<br>
>>     Jan  5 13:40:10 testbench06 ccsd[13194]: Unable to connect to<br>
>> cluster infrastructure after 1193670 seconds.<br>
>>     Jan  5 13:40:24 testbench06 openais[3939]: [MAIN ] AIS Executive<br>
>> Service RELEASE 'subrev 1887 version 0.80.6'<br>
>>     Jan  5 13:40:24 testbench06 openais[3939]: [MAIN ] Copyright (C)<br>
>> 2002-2006 MontaVista Software, Inc and contributors.<br>
>>     Jan  5 13:40:24 testbench06 openais[3939]: [MAIN ] Copyright (C)<br>
>> 2006 Red Hat, Inc.<br>
>>     Jan  5 13:40:24 testbench06 openais[3939]: [MAIN ] AIS Executive<br>
>> Service: started and ready to provide service.<br>
>>     Jan  5 13:40:24 testbench06 openais[3939]: [MAIN ] local node name<br>
>> "<a href="http://test01.gdao.ucsc.edu" target="_blank">test01.gdao.ucsc.edu</a>" not found in cluster.conf<br>
>>     Jan  5 13:40:24 testbench06 openais[3939]: [MAIN ] Error reading CCS<br>
>> info, cannot start<br>
>>     Jan  5 13:40:24 testbench06 openais[3939]: [MAIN ] Error reading<br>
>> config from CCS<br>
>>     Jan  5 13:40:24 testbench06 openais[3939]: [MAIN ] AIS Executive<br>
>> exiting (reason: could not read the main configuration file).<br>
>><br>
>> Here are details of my configuration:<br>
>><br>
>>     [root@test01]# rpm -qa | grep cman<br>
>>     cman-2.0.115-85.el5_7.2<br>
>><br>
>>     [root@test01]# echo $HOSTNAME<br>
>>     <a href="http://test01.gdao.ucsc.edu" target="_blank">test01.gdao.ucsc.edu</a><br>
>><br>
>>     [root@test01]# hostname<br>
>>     <a href="http://test01.gdao.ucsc.edu" target="_blank">test01.gdao.ucsc.edu</a><br>
>><br>
>>     [root@test01]# cat /etc/hosts<br>
>>     # Do not remove the following line, or various programs<br>
>>     # that require network functionality will fail.<br>
>>     128.114.31.112      test01 test01.gdao <a href="http://test01.gdao.ucsc.edu" target="_blank">test01.gdao.ucsc.edu</a><br>
>>     128.114.31.113      test02 test02.gdao <a href="http://test02.gdao.ucsc.edu" target="_blank">test02.gdao.ucsc.edu</a><br>
>>     127.0.0.1               localhost.localdomain localhost<br>
>>     ::1             localhost6.localdomain6 localhost6<br>
>><br>
>>     [root@test01]# sestatus<br>
>>     SELinux status:                 enabled<br>
>>     SELinuxfs mount:                /selinux<br>
>>     Current mode:                   permissive<br>
>>     Mode from config file:          permissive<br>
>>     Policy version:                 21<br>
>>     Policy from config file:        targeted<br>
>><br>
>>     [root@test01]# cat /etc/cluster/cluster.conf<br>
>>     <?xml version="1.0"?><br>
>>     <cluster config_version="25" name="gdao_cluster"><br>
>>         <fence_daemon post_fail_delay="0" post_join_delay="120"/><br>
>>         <clusternodes><br>
>>             <clusternode name="test01" nodeid="1" votes="1"><br>
>>                 <fence><br>
>>                     <method name="single"><br>
>>                         <device name="gfs_vmware"/><br>
>>                     </method><br>
>>                 </fence><br>
>>             </clusternode><br>
>>             <clusternode name="test02" nodeid="2" votes="1"><br>
>>                 <fence><br>
>>                     <method name="single"><br>
>>                         <device name="gfs_vmware"/><br>
>>                     </method><br>
>>                 </fence><br>
>>             </clusternode><br>
>>         </clusternodes><br>
>>         <cman/><br>
>>         <fencedevices><br>
>>             <fencedevice agent="fence_manual" name="gfs1_ipmi"/><br>
>>             <fencedevice agent="fence_vmware" name="gfs_vmware"<br>
>> ipaddr="<a href="http://gdvcenter.ucsc.edu" target="_blank">gdvcenter.ucsc.edu</a>" login="root" passwd="1hateAmazon.com"<br>
>> vmlogin="root" vmpasswd="esxpass"<br>
>> port="/vmfs/volumes/49086551-c64fd83c-0401-001e0bcd6848/eagle1/gfs1.vmx"/><br>
>>         </fencedevices><br>
>>         <rm><br>
>>         <failoverdomains/><br>
>>         </rm><br>
>>     </cluster><br>
>><br>
>> I've seen much discussion of this problem, but no definitive solutions.<br>
>> Any help you can provide will be welcome.<br>
>><br>
>> Wes Modes<br>
>><br>
>> --<br>
>> Linux-cluster mailing list<br>
>> <a href="mailto:Linux-cluster@redhat.com">Linux-cluster@redhat.com</a><br>
>> <a href="https://www.redhat.com/mailman/listinfo/linux-cluster" target="_blank">https://www.redhat.com/mailman/listinfo/linux-cluster</a><br>
><br>
> --<br>
> Linux-cluster mailing list<br>
> <a href="mailto:Linux-cluster@redhat.com">Linux-cluster@redhat.com</a><br>
> <a href="https://www.redhat.com/mailman/listinfo/linux-cluster" target="_blank">https://www.redhat.com/mailman/listinfo/linux-cluster</a><br>
<br>
--<br>
Linux-cluster mailing list<br>
<a href="mailto:Linux-cluster@redhat.com">Linux-cluster@redhat.com</a><br>
<a href="https://www.redhat.com/mailman/listinfo/linux-cluster" target="_blank">https://www.redhat.com/mailman/listinfo/linux-cluster</a><br>
</div></div></blockquote></div><br><br clear="all"><div><br></div>-- <br>Luiz Gustavo P Tonello.<br>
</div>