- Forgot about ulimit, not sure why... I deal with Oracle almost daily. I've adjusted my ulimit nofile setting (both soft and hard):<br><br><div style="margin-left:40px"># ulimit -a | grep files<br>open files                      (-n) 4096<br>
<br># ulimit -aH | grep files<br>open files                      (-n) 65000<br><br></div>- There is a /var/lib/pgsql/data/base/pgsql_tmp/ folder, but it is empty at the moment; I will keep an eye on it.<br><br>- I have the keepalive changed at the sysctl level as every time I do so on the postgresql side, I cannot do so much as cancel a scheduled task without the app going 503 on me. Neither sysctl or postgresql.conf changes appear to help in this case, regardless of what I set them to.<br>
<br>Thanks again for your time and assistance with this frustrating issue o' mine,<br>Jonathan<br><br><div class="gmail_quote">On Thu, Sep 20, 2012 at 2:09 PM, Paul Robert Marino <span dir="ltr"><<a href="mailto:prmarino1@gmail.com" target="_blank">prmarino1@gmail.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">well thats one part of it but also<br>
ulimit -n<br>
which can be set persistently with a nofile entry in<br>
/etc/security/limits.conf or equivalent file in<br>
/etc/security/limits.d/<br>
<br>
there is also one more thing do you have a<br>
/var/lib/pgsql/data/base/pgsql_tmp/ directory and does it contain<br>
files. the existence of that directory indicates there was a query<br>
that required more memory than it was allowed to use.<br>
<br>
<br>
I suspect you may have a query thats timing out and the space walk<br>
kills the connection uncleanly and leaves behind artifact connections.<br>
or possibly you may be reaching a file handle limit on one of the<br>
spacewalk processes and keep in mind an network socket is counted as a<br>
file.<br>
<br>
<br>
<br>
also in the postgresql.conf look at the section about TCP keepalive<br>
<br>
<br>
"<br>
# - TCP Keepalives -<br>
# see "man 7 tcp" for details<br>
<br>
#tcp_keepalives_idle = 0                # TCP_KEEPIDLE, in seconds;<br>
                                        # 0 selects the system default<br>
#tcp_keepalives_interval = 0            # TCP_KEEPINTVL, in seconds;<br>
                                        # 0 selects the system default<br>
#tcp_keepalives_count = 0               # TCP_KEEPCNT;<br>
                                        # 0 selects the system default<br>
"<br>
<br>
note all of these have have a value greater than 1<br>
setting these flags should cull any connections from clients that are<br>
no longer there.<br>
<div class="HOEnZb"><div class="h5"><br>
On Thu, Sep 20, 2012 at 1:42 PM, Jonathan Scott <<a href="mailto:lists@xistenz.org">lists@xistenz.org</a>> wrote:<br>
> By this, do you mean the "fs.file-max" kernel parameter? If so, no I have<br>
> not; I am still at the default.<br>
><br>
> - Jonathan<br>
><br>
><br>
> On Thu, Sep 20, 2012 at 1:12 PM, Paul Robert Marino <<a href="mailto:prmarino1@gmail.com">prmarino1@gmail.com</a>><br>
> wrote:<br>
>><br>
>> Also did either of you tune the max open file limit<br>
>><br>
>> On Sep 20, 2012 1:08 PM, "Paul Robert Marino" <<a href="mailto:prmarino1@gmail.com">prmarino1@gmail.com</a>> wrote:<br>
>>><br>
>>> I think I may have some idea on what may be causing this but I haven't<br>
>>> had time to look. At it yet. Did eitherof you tune the sort memory or<br>
>>> working memory in your postgres.conf<br>
>>><br>
>>> On Sep 20, 2012 10:20 AM, "Patrick Hurrelmann"<br>
>>> <<a href="mailto:patrick.hurrelmann@lobster.de">patrick.hurrelmann@lobster.de</a>> wrote:<br>
>>>><br>
>>>> On 20.09.2012 16:04, Jonathan Scott wrote:<br>
>>>> > Paul,<br>
>>>> ><br>
>>>> > This is reading like the exact same issue you and I discussed on-list<br>
>>>> > a<br>
>>>> > few weeks ago. I had closed out that thread as resolved, but the issue<br>
>>>> > has since creeped its way back up. Patrick breaks it down well, I too<br>
>>>> > just get a pile up of "idle in transaction" db connections which do<br>
>>>> > not<br>
>>>> > clear with any configuration change I have made (tcp timeout, idle<br>
>>>> > timeout and connection limit adjustments in postgresql.conf); a<br>
>>>> > restart<br>
>>>> > of all associated services gives me about 3-5 days before the app<br>
>>>> > becomes unresponsive.<br>
>>>> ><br>
>>>> > Patrick, may I ask how are you loading your errata?<br>
>>>> ><br>
>>>> > - Jonathan<br>
>>>><br>
>>>> As a short update: I missed one node that had osad still running. Osad<br>
>>>> was disabled there as well. I no longer have any update queries waiting.<br>
>>>> There are still some idle transactions, but the number is way lower now.<br>
>>>> I have the strong feeling that this is all connected osad and push to<br>
>>>> clients. Anyone else?<br>
>>>><br>
>>>> But back to your question. I'm running David Nutter's centos-errata.py<br>
>>>> on a nightly basis directly after a spacewalk restart.<br>
>>>><br>
>>>> Regards<br>
>>>> Patrick<br>
>>>><br>
>>>> --<br>
>>>> Lobster LOGsuite GmbH, Münchner Straße 15a, D-82319 Starnberg<br>
>>>><br>
>>>> HRB 178831, Amtsgericht München<br>
>>>> Geschäftsführer: Dr. Martin Fischer, Rolf Henrich<br>
>>>><br>
>>>> _______________________________________________<br>
>>>> Spacewalk-list mailing list<br>
>>>> <a href="mailto:Spacewalk-list@redhat.com">Spacewalk-list@redhat.com</a><br>
>>>> <a href="https://www.redhat.com/mailman/listinfo/spacewalk-list" target="_blank">https://www.redhat.com/mailman/listinfo/spacewalk-list</a><br>
>><br>
>><br>
>> _______________________________________________<br>
>> Spacewalk-list mailing list<br>
>> <a href="mailto:Spacewalk-list@redhat.com">Spacewalk-list@redhat.com</a><br>
>> <a href="https://www.redhat.com/mailman/listinfo/spacewalk-list" target="_blank">https://www.redhat.com/mailman/listinfo/spacewalk-list</a><br>
><br>
><br>
><br>
> _______________________________________________<br>
> Spacewalk-list mailing list<br>
> <a href="mailto:Spacewalk-list@redhat.com">Spacewalk-list@redhat.com</a><br>
> <a href="https://www.redhat.com/mailman/listinfo/spacewalk-list" target="_blank">https://www.redhat.com/mailman/listinfo/spacewalk-list</a><br>
</div></div></blockquote></div><br>