<html><head><style type="text/css"><!-- DIV {margin:0px;} --></style></head><body><div style="font-family:times new roman, new york, times, serif;font-size:10pt"><div style="font-family: times new roman,new york,times,serif; font-size: 10pt;">Hi, I think I'll post mine. <br>I'm using a GNBD device formated as GFS2 (min-gfs.txt) to share a Compass/Lucene search engine index between two instances of a web app. If one of the instances creates the index, the other one won't be able to read it, whether the first one is running or not, throwing java.io.IOException: read past EOF.<br><br>I might have configured sth wrong, but the thing is that if I format the device as GFS, instead of GFS2, then this issue does not occur.<br><br>Regards<br><br><br><div style="font-family: times new roman,new york,times,serif; font-size: 12pt;">----- Original Message ----<br>From: Steven Whitehouse <swhiteho@redhat.com><br>To: linux clustering
 <linux-cluster@redhat.com><br>Sent: Wednesday, May 7, 2008 2:09:21 PM<br>Subject: Re: [Linux-cluster] GFS vs GFS2<br><br>
Hi,<br><br>On Wed, 2008-05-07 at 13:44 +0200, Jonas Björklund wrote:<br>> Hello,<br>> <br>> I would like to know also...<br>> <br>> /Jonas<br>> <br>> On Wed, 7 May 2008, Vimal Gupta wrote:<br>> <br>> > Hi,<br>> ><br>> > I have the same question.???<br>> > Anybody has the answer Please.......???<br>> ><br>> > Chris Picton wrote:<br>> >>  Hi All<br>> >><br>> >>  I am investigating a new cluster installation.<br>> >><br>> >>  Documentation from redhat indicates that GFS2 is not yet production ready.<br>> >>  Tests I have run show it is *much* faster that gfs for my workload.<br>> >><br>> >>  Is GFS2 not production-ready due to lack of testing, or due to known bugs?<br>> >><br>> >>  Any advice would be appreciated<br>> >><br>> >>  Chris<br>>
 >><br><br>The answer is a bit of both. We are getting to the stage where the known<br>bugs are mostly solved or will be very shortly. You can see the state of<br>the bug list at any time by going to <a target="_blank" href="http://bugzilla.redhat.com">bugzilla.redhat.com</a> and looking for<br>any bug with gfs2 in the summary line. There are currently approx 70<br>such bugs, but please bear in mind that a large number of these are<br>asking for new features, and some of them are duplicates of the same bug<br>across different versions of RHEL and/or Fedora.<br><br>We are currently at a stage where having a large number of people<br>helping us in testing would be very helpful. If you have your own<br>favourite filesystem test, or if you are in a position to run a test<br>application, then we would be very interested in any reports of<br>success/failure.<br><br>If you do have any problems, then please do:<br> o Check bugzilla to see if someone else
 has had the same problem<br> o Report them (preferably via bugzilla, as that ensures that they won't<br>get lost somewhere)<br> o Report them as "Fedora, rawhide" if they relate to the upstream<br>kernel (either Linus' tree or my -nmw git tree) and indicate in the<br>comments section which of these kernels you were using<br> o Send patches if you have them, but please don't let that stop you<br>reporting bugs. All reports are useful. We might not be able to always<br>fix each and every report right away, but sometimes patterns emerge via<br>a number of reports which do allow us to home in on a particularly<br>tricky issue.<br> o If you experience a hang, then please include (if possible):<br>    - A glock lock dump from all nodes (via debugfs)<br>    - A dlm lock dump from all nodes (via debugfs)<br>    - A stack trace from all nodes (echo t >/proc/sysrq-trigger)<br> o If you experience an oops, then please make sure
 that you include all<br>the messages (including those which might have been logged just before<br>the oops itself).<br><br>The more people we have testing & reporting bugs, the quicker we can<br>approach stability.<br><br>There is one issue which I'm currently working on relating to a (fairly<br>rare, but nonetheless possible) race. This happens when two threads<br>calling ->readpage() race with each other. The reason that this is<br>problematic is that its the one place left where we are using "try<br>locks" to get around the page lock/glock lock ordering problem and the<br>VFS's AOP_TRUNCATED_PAGE return code is not guaranteed to result in<br>->readpage() being called again if another ->readpage() has raced with<br>it and brought the page uptodate. As a result "try locks" are the only<br>option, but for long and complicated reasons when a "try lock" is queued<br>it might end up triggering a demotion (if a request is pending from
 a<br>remote node) which deadlocks due to page lock/glock ordering.<br><br>The patch I'm working on at the moment, fixes that problem by failing<br>the glock (GLR_TRYFAILED) if a demote is needed and scheduling the glock<br>workqueue to deal with the demotion, thus avoiding the race. The try<br>lock will then be retried at a later date when it can be successful.<br><br>The bugzilla for this is #432057 if you want to follow my progress.<br><br>Steve.<br><br><br>--<br>Linux-cluster mailing list<br><a ymailto="mailto:Linux-cluster@redhat.com" href="mailto:Linux-cluster@redhat.com">Linux-cluster@redhat.com</a><br><a href="https://www.redhat.com/mailman/listinfo/linux-cluster" target="_blank">https://www.redhat.com/mailman/listinfo/linux-cluster</a><br></div></div></div><br>



      <hr size=1>Be a better friend, newshound, and 
know-it-all with Yahoo! Mobile. <a href="http://us.rd.yahoo.com/evt=51733/*http://mobile.yahoo.com/;_ylt=Ahu06i62sR8HDtDypao8Wcj9tAcJ "> Try it now.</a></body></html>