<html><head><style type='text/css'>p { margin: 0; }</style></head><body><div style='font-family: Arial, Helvetica, sans-serif; font-size: 12pt; color: #000000'>I just come back from a trip and made some changes at my cluster.conf but now I am getting a more clear error:<br><br>May 10 20:27:23 vmapache2 ccsd[1550]: Error while processing disconnect:
 Invalid request descriptor
<br>
May 10 20:27:23 vmapache2 fenced[1620]: fence "vmapache1.foo.com" 
failed

<br><br>Also I got more information telling me that cluster services on node 1 are down, when I restart rgmanager it starts working.<br><br>More details:<br><br>[root@vmapache2 ~]# service rgmanager status
<br>Se está ejecutando clurgmgrd (pid  1866)...
<br>[root@vmapache2 ~]# cman_tool status
<br>Version: 6.2.0
<br>Config Version: 60
<br>Cluster Name: clusterapache01
<br>Cluster Id: 38965
<br>Cluster Member: Yes
<br>Cluster Generation: 300
<br>Membership state: Cluster-Member
<br>Nodes: 2
<br>Expected votes: 3
<br>Quorum device votes: 1
<br>Total votes: 3
<br>Quorum: 2
<br>Active subsystems: 10
<br>Flags: Dirty
<br>Ports Bound: 0 11 177
<br>Node name: vmapache2.foo.com
<br>Node ID: 2
<br>Multicast addresses: 225.0.0.1
<br>Node addresses: 172.19.168.122
<br>[root@vmapache2 ~]#
<br> <br>/Var/log/messages
<br> <br>May 10 20:27:07 vmapache2 openais[1562]: [CLM  ] got nodejoin message 172.19.168.121
<br>May 10 20:27:07 vmapache2 openais[1562]: [CLM  ] got nodejoin message 172.19.168.122
<br>May 10 20:27:07 vmapache2 openais[1562]: [CPG  ] got joinlist message from node 2
<br>May 10 20:27:23 vmapache2 fenced[1620]: agent "fence_xvm" reports: Timed out waiting for response
<br>May 10 20:27:23 vmapache2 ccsd[1550]: Attempt to close an unopened CCS descriptor (35940).
<br>May 10 20:27:23 vmapache2 ccsd[1550]: Error while processing disconnect: Invalid request descriptor
<br>May 10 20:27:23 vmapache2 fenced[1620]: fence "vmapache1.foo.com" failed
<br>May 10 20:27:29 vmapache2 kernel: dlm: connecting to 1
<br>May 10 20:27:29 vmapache2 kernel: dlm: got connection from 1
<br>May 10 20:27:41 vmapache2 clurgmgrd[1867]: <info> State change: vmapache1.foo.com UP
<br>May 10 20:27:07 vmapache2 openais[1562]: [CLM  ] got nodejoin message 172.19.168.121
<br>May 10 20:27:07 vmapache2 openais[1562]: [CLM  ] got nodejoin message 172.19.168.122
<br>May 10 20:27:07 vmapache2 openais[1562]: [CPG  ] got joinlist message from node 2
<br>May 10 20:27:23 vmapache2 fenced[1620]: agent "fence_xvm" reports: Timed out waiting for response
<br>May 10 20:27:23 vmapache2 ccsd[1550]: Attempt to close an unopened CCS descriptor (35940).
<br>May 10 20:27:23 vmapache2 ccsd[1550]: Error while processing disconnect: Invalid request descriptor
<br>May 10 20:27:23 vmapache2 fenced[1620]: fence "vmapache1.foo.com" failed
<br>May 10 20:27:29 vmapache2 kernel: dlm: connecting to 1
<br>May 10 20:27:29 vmapache2 kernel: dlm: got connection from 1
<br>May 10 20:27:41 vmapache2 clurgmgrd[1867]: <info> State change: vmapache1.foo.com UP
<br> <br> <br>[root@vmapache2 ~]# tail -n 100 /var/log/messages
<br>May 10 20:24:25 vmapache2 openais[1562]: [TOTEM] Receive multicast socket recv buffer size (288000 bytes).
<br>May 10 20:24:25 vmapache2 openais[1562]: [TOTEM] Transmit multicast socket send buffer size (262142 bytes).
<br>May 10 20:24:25 vmapache2 openais[1562]: [TOTEM] entering GATHER state from 2.
<br>May 10 20:24:30 vmapache2 openais[1562]: [TOTEM] entering GATHER state from 0.
<br>May 10 20:24:30 vmapache2 openais[1562]: [TOTEM] Creating commit token because I am the rep.
<br>May 10 20:24:30 vmapache2 openais[1562]: [TOTEM] Saving state aru 49 high seq received 49
<br>May 10 20:24:30 vmapache2 openais[1562]: [TOTEM] Storing new sequence id for ring 128
<br>May 10 20:24:30 vmapache2 openais[1562]: [TOTEM] entering COMMIT state.
<br>May 10 20:24:30 vmapache2 openais[1562]: [TOTEM] entering RECOVERY state.
<br>May 10 20:24:30 vmapache2 openais[1562]: [TOTEM] position [0] member 172.19.168.122:
<br>May 10 20:24:30 vmapache2 openais[1562]: [TOTEM] previous ring seq 292 rep 172.19.168.121
<br>May 10 20:24:30 vmapache2 openais[1562]: [TOTEM] aru 49 high delivered 49 received flag 1
<br>May 10 20:24:30 vmapache2 openais[1562]: [TOTEM] Did not need to originate any messages in recovery.
<br>May 10 20:24:30 vmapache2 openais[1562]: [TOTEM] Sending initial ORF token
<br>May 10 20:24:30 vmapache2 openais[1562]: [CLM  ] CLM CONFIGURATION CHANGE
<br>May 10 20:24:30 vmapache2 openais[1562]: [CLM  ] New Configuration:
<br>May 10 20:24:30 vmapache2 fenced[1620]: vmapache1.foo.com not a cluster member after 0 sec post_fail_delay
<br>May 10 20:24:30 vmapache2 kernel: dlm: closing connection to node 1
<br>May 10 20:24:30 vmapache2 clurgmgrd[1867]: <info> State change: vmapache1.foo.com DOWN
<br>May 10 20:24:30 vmapache2 openais[1562]: [CLM  ]        r(0) ip(172.19.168.122)
<br>May 10 20:24:30 vmapache2 fenced[1620]: fencing node "vmapache1.foo.com"
<br>May 10 20:24:30 vmapache2 openais[1562]: [CLM  ] Members Left:
<br>May 10 20:24:30 vmapache2 openais[1562]: [CLM  ]        r(0) ip(172.19.168.121)
<br>May 10 20:24:30 vmapache2 openais[1562]: [CLM  ] Members Joined:
<br>May 10 20:24:30 vmapache2 openais[1562]: [CLM  ] CLM CONFIGURATION CHANGE
<br>May 10 20:24:30 vmapache2 openais[1562]: [CLM  ] New Configuration:
<br>May 10 20:24:30 vmapache2 openais[1562]: [CLM  ]        r(0) ip(172.19.168.122)
<br>May 10 20:24:30 vmapache2 openais[1562]: [CLM  ] Members Left:
<br>May 10 20:24:30 vmapache2 openais[1562]: [CLM  ] Members Joined:
<br>May 10 20:24:30 vmapache2 openais[1562]: [SYNC ] This node is within the primary component and will provide service.
<br>May 10 20:24:30 vmapache2 openais[1562]: [TOTEM] entering OPERATIONAL state.
<br>May 10 20:24:30 vmapache2 openais[1562]: [CLM  ] got nodejoin message 172.19.168.122
<br>May 10 20:24:30 vmapache2 openais[1562]: [CPG  ] got joinlist message from node 2
<br>May 10 20:24:35 vmapache2 clurgmgrd[1867]: <info> Waiting for node #1 to be fenced
<br>May 10 20:24:47 vmapache2 qdiskd[1604]: <info> Assuming master role
<br>May 10 20:24:49 vmapache2 openais[1562]: [CMAN ] lost contact with quorum device
<br>May 10 20:24:49 vmapache2 openais[1562]: [CMAN ] quorum lost, blocking activity
<br>May 10 20:24:49 vmapache2 clurgmgrd[1867]: <emerg> #1: Quorum Dissolved
<br>May 10 20:24:49 vmapache2 qdiskd[1604]: <notice> Writing eviction notice for node 1
<br>May 10 20:24:49 vmapache2 openais[1562]: [CMAN ] quorum regained, resuming activity
<br>May 10 20:24:49 vmapache2 clurgmgrd: [1867]: <info> Stopping Service apache:web1
<br>May 10 20:24:49 vmapache2 clurgmgrd: [1867]: <err> Checking Existence Of File /var/run/cluster/apache/apache:web1.pid [apache:web1] > Failed - File Doesn't Exist
<br>May 10 20:24:49 vmapache2 clurgmgrd: [1867]: <info> Stopping Service apache:web1 > Succeed
<br>May 10 20:24:49 vmapache2 clurgmgrd[1867]: <notice> Quorum Regained
<br>May 10 20:24:49 vmapache2 clurgmgrd[1867]: <info> State change: Local UP
<br>May 10 20:24:51 vmapache2 qdiskd[1604]: <notice> Node 1 evicted
<br>May 10 20:25:00 vmapache2 fenced[1620]: agent "fence_xvm" reports: Timed out waiting for response
<br>May 10 20:25:00 vmapache2 ccsd[1550]: Attempt to close an unopened CCS descriptor (32130).
<br>May 10 20:25:00 vmapache2 ccsd[1550]: Error while processing disconnect: Invalid request descriptor
<br>May 10 20:25:00 vmapache2 fenced[1620]: fence "vmapache1.foo.com" failed
<br>May 10 20:25:05 vmapache2 fenced[1620]: fencing node "vmapache1.foo.com"
<br>May 10 20:25:36 vmapache2 fenced[1620]: agent "fence_xvm" reports: Timed out waiting for response
<br>May 10 20:25:36 vmapache2 ccsd[1550]: Attempt to close an unopened CCS descriptor (33270).
<br>May 10 20:25:36 vmapache2 ccsd[1550]: Error while processing disconnect: Invalid request descriptor
<br>May 10 20:25:36 vmapache2 fenced[1620]: fence "vmapache1.foo.com" failed
<br>May 10 20:25:41 vmapache2 fenced[1620]: fencing node "vmapache1.foo.com"
<br>May 10 20:26:11 vmapache2 fenced[1620]: agent "fence_xvm" reports: Timed out waiting for response
<br>May 10 20:26:11 vmapache2 fenced[1620]: fence "vmapache1.foo.com" failed
<br>May 10 20:26:16 vmapache2 fenced[1620]: fencing node "vmapache1.foo.com"
<br>May 10 20:26:47 vmapache2 fenced[1620]: agent "fence_xvm" reports: Timed out waiting for response
<br>May 10 20:26:47 vmapache2 ccsd[1550]: Attempt to close an unopened CCS descriptor (35010).
<br>May 10 20:26:47 vmapache2 ccsd[1550]: Error while processing disconnect: Invalid request descriptor
<br>May 10 20:26:47 vmapache2 fenced[1620]: fence "vmapache1.foo.com" failed
<br>May 10 20:26:52 vmapache2 fenced[1620]: fencing node "vmapache1.foo.com"
<br>May 10 20:27:07 vmapache2 openais[1562]: [TOTEM] entering GATHER state from 11.
<br>May 10 20:27:07 vmapache2 openais[1562]: [TOTEM] Saving state aru 10 high seq received 10
<br>May 10 20:27:07 vmapache2 openais[1562]: [TOTEM] Storing new sequence id for ring 12c
<br>May 10 20:27:07 vmapache2 openais[1562]: [TOTEM] entering COMMIT state.
<br>May 10 20:27:07 vmapache2 openais[1562]: [TOTEM] entering RECOVERY state.
<br>May 10 20:27:07 vmapache2 openais[1562]: [TOTEM] position [0] member 172.19.168.121:
<br>May 10 20:27:07 vmapache2 openais[1562]: [TOTEM] previous ring seq 296 rep 172.19.168.121
<br>May 10 20:27:07 vmapache2 openais[1562]: [TOTEM] aru a high delivered a received flag 1
<br>May 10 20:27:07 vmapache2 openais[1562]: [TOTEM] position [1] member 172.19.168.122:
<br>May 10 20:27:07 vmapache2 openais[1562]: [TOTEM] previous ring seq 296 rep 172.19.168.122
<br>May 10 20:27:07 vmapache2 openais[1562]: [TOTEM] aru 10 high delivered 10 received flag 1
<br>May 10 20:27:07 vmapache2 openais[1562]: [TOTEM] Did not need to originate any messages in recovery.
<br>May 10 20:27:07 vmapache2 openais[1562]: [CLM  ] CLM CONFIGURATION CHANGE
<br>May 10 20:27:07 vmapache2 openais[1562]: [CLM  ] New Configuration:
<br>May 10 20:27:07 vmapache2 openais[1562]: [CLM  ]        r(0) ip(172.19.168.122)
<br>May 10 20:27:07 vmapache2 openais[1562]: [CLM  ] Members Left:
<br>May 10 20:27:07 vmapache2 openais[1562]: [CLM  ] Members Joined:
<br>May 10 20:27:07 vmapache2 openais[1562]: [CLM  ] CLM CONFIGURATION CHANGE
<br>May 10 20:27:07 vmapache2 openais[1562]: [CLM  ] New Configuration:
<br>May 10 20:27:07 vmapache2 openais[1562]: [CLM  ]        r(0) ip(172.19.168.121)
<br>May 10 20:27:07 vmapache2 openais[1562]: [CLM  ]        r(0) ip(172.19.168.122)
<br>May 10 20:27:07 vmapache2 openais[1562]: [CLM  ] Members Left:
<br>May 10 20:27:07 vmapache2 openais[1562]: [CLM  ] Members Joined:
<br>May 10 20:27:07 vmapache2 openais[1562]: [CLM  ]        r(0) ip(172.19.168.121)
<br>May 10 20:27:07 vmapache2 openais[1562]: [SYNC ] This node is within the primary component and will provide service.
<br>May 10 20:27:07 vmapache2 openais[1562]: [TOTEM] entering OPERATIONAL state.
<br>May 10 20:27:07 vmapache2 openais[1562]: [CLM  ] got nodejoin message 172.19.168.121
<br>May 10 20:27:07 vmapache2 openais[1562]: [CLM  ] got nodejoin message 172.19.168.122
<br>May 10 20:27:07 vmapache2 openais[1562]: [CPG  ] got joinlist message from node 2
<br>May 10 20:27:23 vmapache2 fenced[1620]: agent "fence_xvm" reports: Timed out waiting for response
<br>May 10 20:27:23 vmapache2 ccsd[1550]: Attempt to close an unopened CCS descriptor (35940).
<br>May 10 20:27:23 vmapache2 ccsd[1550]: Error while processing disconnect: Invalid request descriptor
<br>May 10 20:27:23 vmapache2 fenced[1620]: fence "vmapache1.foo.com" failed
<br>May 10 20:27:29 vmapache2 kernel: dlm: connecting to 1
<br>May 10 20:27:29 vmapache2 kernel: dlm: got connection from 1
<br>May 10 20:27:41 vmapache2 clurgmgrd[1867]: <info> State change: vmapache1.foo.com UP<br><br><span>Here is my cluster.conf file:<br><br><?xml version="1.0"?><br><cluster alias="clusterapache01" config_version="60" name="clusterapache01"><br>    <fence_daemon clean_start="0" post_fail_delay="0" post_join_delay="60"/><br>    <clusternodes><br>        <clusternode name="vmapache1.foo.com" nodeid="1" votes="1"><br>            <fence><br>                <method name="1"><br>                    <device domain="vmapache1" name="xenfence1"/><br>                </method><br>            </fence><br>            <multicast addr="225.0.0.1" interface="eth1"/><br>        </clusternode><br>        <clusternode name="vmapache2.foo.com" nodeid="2" votes="1"><br>            <fence><br>                <method name="1"><br>                    <device domain="vmapache2" name="xenfence2"/><br>                </method><br>            </fence><br>            <multicast addr="225.0.0.1" interface="eth1"/><br>        </clusternode><br>    </clusternodes><br>    <cman expected_votes="3"><br>        <multicast addr="225.0.0.1"/><br>    </cman><br>    <fencedevices><br>        <fencedevice agent="fence_xvm" key_file="/etc/cluster/fence_xvm-host1.key" name="xenfence1"/><br>        <fencedevice agent="fence_xvm" key_file="/etc/cluster/fence_xvm-host2.key" name="xenfence2"/><br>    </fencedevices><br>    <rm log_level="7"><br>        <failoverdomains><br>            <failoverdomain name="prefer_node1" nofailback="1" ordered="1" restricted="1"><br>                <failoverdomainnode name="vmapache1.foo.com" priority="1"/><br>                <failoverdomainnode name="vmapache2.foo.com" priority="2"/><br>            </failoverdomain><br>        </failoverdomains><br>        <resources><br>            <ip address="172.19.52.120" monitor_link="1"/><br>            <netfs export="/data" force_unmount="0" fstype="nfs4" host="172.19.50.114" mountpoint="/var/www/html" name="htdoc" options="rw,no_root_squash"/><br>            <apache config_file="conf/httpd.conf" name="web1" server_root="/etc/httpd" shutdown_wait="0"/><br>        </resources><br>        <service autostart="1" domain="prefer_node1" exclusive="0" name="web-scs" recovery="relocate"><br>            <ip ref="172.19.52.120"/><br>            <apache ref="web1"/><br>        </service><br>    </rm><br>    <fence_xvmd/><br>    <totem consensus="4800" join="60" token="10000" token_retransmits_before_loss_const="20"/><br>    <quorumd device="/dev/sda1" interval="2" min_score="1" tko="10" votes="1"><br>        <heuristic interval="2" program="ping -c1 -t1 172.19.52.119" score="1"/><br>    </quorumd><br></cluster><br><br><br></span>Best Regards,<br><br><br><br>Carlos Vermejo Ruiz<br></div></body></html>