<div dir="ltr"><br><div class="gmail_extra"><br><br><div class="gmail_quote">On 18 December 2013 08:41, Chris Adams <span dir="ltr"><<a href="mailto:linux@cmadams.net" target="_blank">linux@cmadams.net</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">I have a system that is a NAT/LVS front-end for a bunch of servers<br>
(mail, web, etc.).  I noticed in my monitoring that, about every 100<br>
minutes, the load average is spiking up to around 3-4 (not just a steady<br>
number, it fluctuates between maybe 2.5 and 4) for around 10 minutes.<br>
Then it drops back to near 0 fairly quickly.<br>
<br></blockquote><div><br></div><div>It could be a number of processes hitting device wait at the same time. Every process in device wait seems to increase the load average by 1. I have seen servers with load averages of 100's running along fine but 100 processes stuck in device wait for a network connection or something and not lowering the average. I would check to see when this happens what is in D state. </div>
<div><br></div><div>The next two areas would be looking at iostat and sar during those times to see what might be causing it to pop up.</div><div><br></div><div>Hope this helps.</div></div><br clear="all"><div><br></div>-- <br>
<div dir="ltr">Stephen J Smoogen.<br><br></div>
</div></div>