<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 3.2//EN">
<HTML>
<HEAD>
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=us-ascii">
<META NAME="Generator" CONTENT="MS Exchange Server version 5.5.2658.34">
<TITLE>RE: [Linux-cluster] GFS performance</TITLE>
</HEAD>
<BODY>

<P><FONT SIZE=2>Thanx a lot Bob for the info. I am in the process of swapping things out to see if that changes things. I am wondering however why performance is even on the OS side (dd, cp, etc, to the GFS filesystem), but not with Clusterware. Interesting. </FONT></P>

<P><FONT SIZE=2>-----Original Message-----</FONT>
<BR><FONT SIZE=2>From: linux-cluster-bounces@redhat.com [<A HREF="mailto:linux-cluster-bounces@redhat.com">mailto:linux-cluster-bounces@redhat.com</A>] On Behalf Of Robert Peterson</FONT>
<BR><FONT SIZE=2>Sent: Friday, December 15, 2006 3:33 PM</FONT>
<BR><FONT SIZE=2>To: linux clustering</FONT>
<BR><FONT SIZE=2>Subject: Re: [Linux-cluster] GFS performance</FONT>
</P>

<P><FONT SIZE=2>Frazier, Darrell USA CRC (Contractor) wrote:</FONT>
<BR><FONT SIZE=2>></FONT>
<BR><FONT SIZE=2>> Hello guru's,</FONT>
<BR><FONT SIZE=2>></FONT>
<BR><FONT SIZE=2>> Interesting problem I am hoping someone on this forum has seen before, </FONT>
<BR><FONT SIZE=2>> and can give me pointers to what may be wrong. Here is the setup:</FONT>
<BR><FONT SIZE=2>></FONT>
<BR><FONT SIZE=2>> 2 HP DL380 G4 systems with RHEL4U4</FONT>
<BR><FONT SIZE=2>> 1 unmanaged switch (for Cluster interconnect and Oracle RAC</FONT>
<BR><FONT SIZE=2>> interconnect.)</FONT>
<BR><FONT SIZE=2>> Public network for Oracle NET and normal network traffic</FONT>
<BR><FONT SIZE=2>> RHCS4 using DLM locking protocol (three servers to keep GULM lock info </FONT>
<BR><FONT SIZE=2>> for a two node RAC seemed pretty wasteful)</FONT>
<BR><FONT SIZE=2>> GFS6.1</FONT>
<BR><FONT SIZE=2>> Oracle Clusterware (latest)</FONT>
<BR><FONT SIZE=2>> Oracle Database 10gR2</FONT>
<BR><FONT SIZE=2>> Fiber-Channel shared storage</FONT>
<BR><FONT SIZE=2>></FONT>
<BR><FONT SIZE=2>> Here is my issue:</FONT>
<BR><FONT SIZE=2>></FONT>
<BR><FONT SIZE=2>> I have set up a two-node Oracle 10gR2 RAC system with RHCS/GFS (OCFS2 </FONT>
<BR><FONT SIZE=2>> was such a disappointment), and Oracle Clusterware. Everything on the </FONT>
<BR><FONT SIZE=2>> OS cluster level is good and fine.</FONT>
<BR><FONT SIZE=2>></FONT>
<BR><FONT SIZE=2>> Shortly after setting up the cluster and handing it over to the DBAs </FONT>
<BR><FONT SIZE=2>> to install Clusterware and Oracle RAC. They come to me saying that </FONT>
<BR><FONT SIZE=2>> they have uneven performance between the nodes. (Node one does </FONT>
<BR><FONT SIZE=2>> adatabase import in an hour whereas the same import on Node2 takes 10</FONT>
<BR><FONT SIZE=2>> hours)</FONT>
<BR><FONT SIZE=2>></FONT>
<BR><FONT SIZE=2>> I have been doing everything I can do on my side using various tools </FONT>
<BR><FONT SIZE=2>> to try to isolate the issue (protocol analysis, iostat, strace, dd to </FONT>
<BR><FONT SIZE=2>> do writes from both nodes to GFS, etc.) and I have been unable to </FONT>
<BR><FONT SIZE=2>> isolate the issue as performance is quite even on an OS level.</FONT>
<BR><FONT SIZE=2>></FONT>
<BR><FONT SIZE=2>> The cluster configuration has been ruled out by Redhat support as an </FONT>
<BR><FONT SIZE=2>> issue. (Yay for me and Redhat!)</FONT>
<BR><FONT SIZE=2>></FONT>
<BR><FONT SIZE=2>> I am hoping someone here has run into issues using Oracle Clusterware </FONT>
<BR><FONT SIZE=2>> on RHCS/GFS.</FONT>
<BR><FONT SIZE=2>></FONT>
<BR><FONT SIZE=2>> Thanx in advance</FONT>
<BR><FONT SIZE=2>></FONT>
<BR><FONT SIZE=2>> *Darrell J. Frazier*</FONT>
<BR><FONT SIZE=2>></FONT>
<BR><FONT SIZE=2>Hi Darrell,</FONT>
</P>

<P><FONT SIZE=2>Well, it's possible you're running into this:</FONT>
</P>

<P><FONT SIZE=2><A HREF="http://sources.redhat.com/cluster/faq.html#gfs_speed1" TARGET="_blank">http://sources.redhat.com/cluster/faq.html#gfs_speed1</A></FONT>
</P>

<P><FONT SIZE=2>To rule that out, perhaps you could do the same sequence of events after a complete cluster reboot, for each node.  It would be interesting to know if the speed factor changes.</FONT></P>

<P><FONT SIZE=2>It could be a number of other things, too, including hardware.  You could try swapping cables and ports on the Ethernet and also the shared storage.  By the way, I'm in the process of adding a new "GFS performance tuning" question to the cluster FAQ that may or may not help.  It should appear in the FAQ soon, pending review by some of the developers here (I don't want to post any misinformation, so I'm having them review it).</FONT></P>

<P><FONT SIZE=2>Regards,</FONT>
</P>

<P><FONT SIZE=2>Bob Peterson</FONT>
<BR><FONT SIZE=2>Red Hat Cluster Suite</FONT>
</P>

<P><FONT SIZE=2>--</FONT>
<BR><FONT SIZE=2>Linux-cluster mailing list</FONT>
<BR><FONT SIZE=2>Linux-cluster@redhat.com</FONT>
<BR><FONT SIZE=2><A HREF="https://www.redhat.com/mailman/listinfo/linux-cluster" TARGET="_blank">https://www.redhat.com/mailman/listinfo/linux-cluster</A></FONT>
</P>

</BODY>
</HTML>