<br>Never mind.<br><br>I was running the entire cluster in VMware on my laptop.<br>The machines managed to drift 25 virtual seconds in just 30 real seconds...<br><br>People running into this should look at:<br><a href="http://www.austintek.com/LVS/LVS-HOWTO/HOWTO/LVS-HOWTO.virtualised_realservers.html">http://www.austintek.com/LVS/LVS-HOWTO/HOWTO/LVS-HOWTO.virtualised_realservers.html</a><br>
<br>Piranha/Pulse simply does not play nice with VMware.<br><br><br>Regards,<br><br>Kit<br><br><br><div class="gmail_quote">On Thu, Dec 18, 2008 at 2:46 PM, Kit Gerrits <span dir="ltr"><<a href="mailto:kitgerrits@gmail.com">kitgerrits@gmail.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="border-left: 1px solid rgb(204, 204, 204); margin: 0pt 0pt 0pt 0.8ex; padding-left: 1ex;">I am seeing the strangest thing:<br>Every 3 minutes or so, the secondary cluster node thinks it can't see the primary cluster node and decides to failover.<br>
When the primary node sees this, it sends out an ARP the secondary node backs off and teh primary takes over again.<br>

<br>Due to local policy, I am building this LVS cluster on RHEL5.2 with <span>piranha</span> and ipvsadm from CentOS5.2<br><br>Aside from a stock RHEL5.2 from DVD, I am running the following software:<br>gmp-4.1.4-10.el5.i386.rpm<br>

ipvsadm-1.24-8.1.i386.rpm<br>
libgomp-4.1.2-42.el5.i386.rpm<br>php-5.1.6-20.el5.i386.rpm<br>php-cli-5.1.6-20.el5.i386.rpm<br>php-common-5.1.6-20.el5.i386.rpm<br><div><span>piranha</span>-0.8.4-9.3.el5.i386.rpm<br>
<br>LVS Config:<br>[@lvs-test1 ~]$ cat /etc/sysconfig/ha/<a href="http://lvs.cf/" target="_blank">lvs.cf</a><br>
serial_no = 57<br>primary = 10.100.77.4<br>primary_private = 192.168.201.11<br>service = lvs<br>backup_active = 1<br>backup = 10.100.76.87<br>backup_private = 192.168.201.12<br>heartbeat = 1<br>heartbeat_port = 539<br>keepalive = 2<br>


deadtime = 10<br>network = nat<br>nat_router = 192.168.201.15 eth0:1<br>nat_nmask = 255.255.255.0<br>debug_level = NONE<br>monitor_links = 1<br>virtual Trac {<br>     active = 1<br>     address = 10.100.77.250 eth1:1<br>

     vip_nmask = 255.255.240.0<br>
     port = 80<br>     persistent = 300<br>     send = "GET / HTTP/1.0\r\n\r\n"<br>     expect = "HTTP"<br>     use_regex = 0<br>     load_monitor = none<br>     scheduler = wlc<br>     protocol = tcp<br>


     timeout = 6<br>     reentry = 15<br>     quiesce_server = 1<br>     server Trac-test1 {<br>         address = 192.168.201.21<br>         active = 1<br>         weight = 500<br>     }<br>     server Trac-Test2 {<br>         address = 192.168.201.22<br>


         active = 1<br>         weight = 500<br>     }<br>}<br><br><br>hosts:<br># Public IPs<br>10.100.77.4     lvs-test1-pub.rdc.local  lvs-test1-pub<br>10.100.76.87    lvs-test2-pub.rdc.local  lvs-test2-pub<br>10.100.77.250  trac-test-pub.rdc.local trac-test-pub.rdc<br>

<br># Private IPs<br>
192.168.201.11  lvs-test1.rdc.local     lvs-test1<br>192.168.201.12  lvs-test2.rdc.local     lvs-test2<br>192.168.201.15  lvs-test-gw.rdc.local   lvs-test-gw<br>192.168.201.21  trac-test1.rdc.local    trac-test1<br>192.168.201.22  trac-test2.rdc.local    trac-test2<br>


<br>Interfaces:<br>lvs-test1:<br>[@lvs-test1 ~]$ /sbin/ifconfig |grep -e Link -e 'inet' |grep -v inet6<br>eth0      Link encap:Ethernet  HWaddr 00:0C:29:C7:5D:05<br>          inet addr:192.168.201.11  Bcast:192.168.201.255  Mask:255.255.255.0<br>


eth0:1    Link encap:Ethernet  HWaddr 00:0C:29:C7:5D:05<br>          inet addr:192.168.201.15  Bcast:192.168.201.255  Mask:255.255.255.0<br>eth1      Link encap:Ethernet  HWaddr 00:0C:29:C7:5D:0F<br>          inet addr:10.100.77.4  Bcast:10.100.79.255  Mask:255.255.240.0<br>


eth1:1    Link encap:Ethernet  HWaddr 00:0C:29:C7:5D:0F<br>          inet addr:10.100.77.250  Bcast:10.100.79.255  Mask:255.255.240.0<br>lo        Link encap:Local Loopback<br>          inet addr:127.0.0.1  Mask:255.0.0.0<br>


<br>lvs-test2:<br>[@lvs-test1 ~]$ /sbin/ifconfig |grep -e Link -e 'inet' |grep -v inet6<br>eth0      Link encap:Ethernet  HWaddr 00:0C:29:D7:F9:6A<br>          inet addr:192.168.201.12  Bcast:192.168.201.255  Mask:255.255.255.0<br>


          inet6 addr: fe80::20c:29ff:fed7:f96a/64 Scope:Link<br>eth1      Link encap:Ethernet  HWaddr 00:0C:29:D7:F9:74<br>          inet addr:10.100.76.87  Bcast:10.100.79.255  Mask:255.255.240.0<br>          inet6 addr: fe80::20c:29ff:fed7:f974/64 Scope:Link<br>


lo        Link encap:Local Loopback<br>          inet addr:127.0.0.1  Mask:255.0.0.0<br><br><br>Routing table:<br>[@lvs-test1 ~]$ netstat -rn<br>Kernel IP routing table<br>Destination     Gateway         Genmask         Flags   MSS Window  irtt Iface<br>


192.168.201.0   0.0.0.0         255.255.255.0   U         0 0          0 eth0<br>10.100.64.0     0.0.0.0         255.255.240.0   U         0 0          0 eth1<br>169.254.0.0     0.0.0.0         255.255.0.0     U         0 0          0 eth1<br>


0.0.0.0         10.100.64.254   0.0.0.0         UG        0 0          0 eth1<br><br>[@lvs-test2 ~]$ netstat -rn<br>Kernel IP routing table<br>Destination     Gateway         Genmask         Flags   MSS Window  irtt Iface<br>


192.168.201.0   0.0.0.0         255.255.255.0   U         0 0          0 eth0<br>10.100.64.0     0.0.0.0         255.255.240.0   U         0 0          0 eth1<br>169.254.0.0     0.0.0.0         255.255.0.0     U         0 0          0 eth1<br>


0.0.0.0         10.100.64.254   0.0.0.0         UG        0 0          0 eth1<br><br><br><br>ARP ping to floating GW IP and APP IP  works from the non-active node:<br>Cluster on lvs-test1:<br>[@lvs-test2 ~]$ sudo /sbin/arping 192.168.201.15<br>


ARPING 192.168.201.15 from 192.168.201.12 eth0<br>Unicast reply from 192.168.201.15 [00:0C:29:C7:5D:05]  3.739ms<br>Unicast reply from 192.168.201.15 [00:0C:29:C7:5D:05]  1.324ms<br>Unicast reply from 192.168.201.15 [00:0C:29:C7:5D:05]  1.332ms<br>


<br>[@lvs-test2 ~]$ sudo /sbin/arping 10.100.77.250<br>ARPING 10.100.77.250 from 192.168.201.12 eth0<br>Unicast reply from 10.100.77.250 [00:0C:29:C7:5D:05]  1.895ms<br>Unicast reply from 10.100.77.250 [00:0C:29:C7:5D:05]  1.441ms<br>


Unicast reply from 10.100.77.250 [00:0C:29:C7:5D:05]  1.395ms<br><br><br>Cluster on lvs-test2:<br>[@lvs-test1 etc]$ sudo /sbin/arping 192.168.201.15<br>ARPING 192.168.201.15 from 192.168.201.11 eth0<br>Unicast reply from 192.168.201.15 [00:0C:29:D7:F9:6A]  3.861ms<br>


Unicast reply from 192.168.201.15 [00:0C:29:D7:F9:6A]  1.499ms<br>Unicast reply from 192.168.201.15 [00:0C:29:D7:F9:6A]  0.934ms<br><br>[@lvs-test1 ~]$ sudo /sbin/arping 10.100.77.250<br>ARPING 10.100.77.250 from 192.168.201.11 eth0<br>


Unicast reply from 10.100.77.250 [00:0C:29:D7:F9:6A]  4.436ms<br>Unicast reply from 10.100.77.250 [00:0C:29:D7:F9:6A]  1.327ms<br>Unicast reply from 10.100.77.250 [00:0C:29:D7:F9:6A]  1.495ms<br><br><br>I have attached 2 files with more-detailed information.<br>

<br># Why does pulse think the secundary is dead, even with 2 interfaces?<br># Why are both internal and  external IP's returning the same MAC address?</div><br>
</blockquote></div><br>