<br><tt><font size=2>fedora-buildsys-list-bounces@redhat.com wrote on 10/31/2006
11:45:56 AM:<br>
<br>
> On Fri, 2006-10-27 at 00:32 -0400, Joe Todaro wrote:<br>
> > <br>
> > Hi, <br>
> > <br>
> > Has anyone ever seen this error before in their *plague-0.5.0*
build<br>
> > environment?   It surfaced last week shortly after we started<br>
> > stress-testing our buildsystem.   In fact, there were three
such<br>
> > errors in all, which I will post separately to avoid any confusion.<br>
> > This is one of three.   It was triggered when we requested
status<br>
> > about a job we killed before it actually got handed-off to archjobs.
<br>
> > <br>
> > ====== THE ERROR ======- <br>
> > Request to enqueue 'stacker' tag 'stacker-1_3-5' for target<br>
> > 'oc-rhel4-dev' (user 'jtodaro@pok.ibm.com') <br>
> > 66 (stacker): Starting tag 'stacker-1_3-5' on target 'oc-rhel4-dev'
<br>
> > 66 (stacker): Requesting depsolve... <br>
> > 66 (stacker): Starting depsolve for arches: ['i686']. <br>
> > 66 (stacker): Finished depsolve (successful), requesting archjobs.
<br>
> > 66 (stacker/i686): https://lnxbuild1.pok.ibm.com.:8888 - UID
is<br>
> > 9adf56cdd15bfae2388966b08837250d3bf6772c <br>
> > ---------------------------------------- <br>
> > Exception happened during processing of request from ('10.63.82.73',<br>
> > 49136) <br>
> > Traceback (most recent call last): <br>
> >   File "/usr/lib64/python2.3/SocketServer.py",
line 463, in<br>
> > process_request_thread <br>
> >     self.finish_request(request, client_address) <br>
> >   File "/usr/lib64/python2.3/SocketServer.py",
line 254, in<br>
> > finish_request <br>
> >     self.RequestHandlerClass(request, client_address,
self) <br>
> >   File "/usr/lib64/python2.3/SocketServer.py",
line 521, in __init__ <br>
> >     self.handle() <br>
> >   File "/usr/lib64/python2.3/BaseHTTPServer.py",
line 324, in handle <br>
> >     self.handle_one_request() <br>
> >   File "/usr/lib64/python2.3/BaseHTTPServer.py",
line 307, in<br>
> > handle_one_request <br>
> >     self.raw_requestline = self.rfile.readline() <br>
> >   File "/usr/lib64/python2.3/socket.py", line
338, in readline <br>
> >     data = self._sock.recv(self._rbufsize) <br>
> >   File "/usr/lib/python2.3/site-packages/plague/SSLConnection.py",<br>
> > line 142, in recv <br>
> >     return con.recv(bufsize, flags) <br>
> > SysCallError: (-1, 'Unexpected EOF') <br>
> > ---------------------------------------- <br>
> > <br>
> > ====== OUR FIX ======  <br>
> > We added lines 147-148 to the *recv* method of the<br>
> > */usr/lib/python2.3/site-packages/plague/SSLConnection.py* module.<br>
> > Here's the patch: <br>
> > <br>
> > <br>
> > So, can someone please review the above fix.. We want to make
sure it<br>
> > won't come back to *bite* us later on / or possibly evn be *masking*
a<br>
> > larger problem.   Thank you. <br>
> <br>
> This one makes me a bit nervous.  The SSL stuff is pretty fragile,
since<br>
> SSL in general adds yet another protocol layer on top of everything<br>
> that's subject to more handshakes and state over just TCP/IP.<br>
> <br>
> The traceback here shouldn't really have an effect, since it just<br>
> terminates the current thread, and plague's state machine is built
to be<br>
> resilient to dropped and dead connection threads.  </font></tt>
<br>
<br><tt><font size=2>Aha - I didn't realize that. So, I will backout our
patch. </font></tt>
<br><tt><font size=2>Thank You so much for the excellent clarification.</font></tt>
<br><tt><font size=2>Joe</font></tt>
<br><tt><font size=2> </font></tt>
<br><tt><font size=2>> I'd like to hide the<br>
> traceback (or at least just print a one-line message) but that's not<br>
> possible since plague code isn't anywhere in the traceback and therefore<br>
> would require more subclassing.<br>
> <br>
> Furthermore, it technically is an error (that the other side closed
the<br>
> socket prematurely or something broke the connection) but one that
we<br>
> should ignore and retry, which plague will do.<br>
> <br>
> However, if this fix seems to work OK for you for a while, I'd be<br>
> interested in revisiting the issue.<br>
> <br>
> Dan<br>
> <br>
> > -Joe <br>
> > --<br>
> > Fedora-buildsys-list mailing list<br>
> > Fedora-buildsys-list@redhat.com<br>
> > https://www.redhat.com/mailman/listinfo/fedora-buildsys-list<br>
> <br>
> --<br>
> Fedora-buildsys-list mailing list<br>
> Fedora-buildsys-list@redhat.com<br>
> https://www.redhat.com/mailman/listinfo/fedora-buildsys-list<br>
</font></tt>