<div dir="ltr"><br><div style>I am using the iscsi tools that is included with Oracle (iscsi-initiator-utils-6.2.0.872-13.0.1.el5). </div><div style><br></div><div style>The values I have in my iscsid.conf are:</div><div style>
node.session.timeo.replacement_timeout = 15<br></div><div style><div>node.conn[0].timeo.noop_out_timeout = 1</div><div><div>node.conn[0].timeo.noop_out_interval = 1</div></div><div><br></div><div style>{i have previously changed the settings from the values based upon some feedback I got from a tech guy but that didn't seem to make much difference}.</div>
<div style><br></div><div style>In regards to the scsi command timeout it appears to be set to 60.</div><div style><div><br></div><div># cat /sys/block/sdw/device/timeout </div><div>60</div><div><br></div><div style>So is my thinking correct that I will want to have the SCSI devices to timeout more quickly like 1 second versus the 60 seconds? If so where would i make this change in regards to the disks???</div>
<div style><br></div><div style>Thanks much.</div><div style><br></div><div style>Devin Acosta</div></div></div></div><div class="gmail_extra"><br><br><div class="gmail_quote">On Sun, Feb 24, 2013 at 4:50 PM, Mike Christie <span dir="ltr"><<a href="mailto:michaelc@cs.wisc.edu" target="_blank">michaelc@cs.wisc.edu</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div class="HOEnZb"><div class="h5">On 02/24/2013 01:15 PM, Devin wrote:<br>
><br>
> I am running Oracle Enterprise Linux 5.8 (which is really just Redhat).<br>
> I am using Multipath and I have LUNS presented to me via iSCSI from a<br>
> Hitachi SAN. I have the NICS bonded using the Linux bonding driver and<br>
> using Active-Backup mode. I notice that when I loose a switch or<br>
> connection to one of the switches that multipath freezes for at least 60<br>
> seconds before it starts to respond again. Also it appears that IO being<br>
> generated freezes until multipath responds again, this pause up to 60<br>
> seconds is causing my Oracle instances to crash.<br>
><br>
> I have not been able to easily find what settings i could possibly<br>
> change to make it fail to a new path faster. It almost seems like it's<br>
> taking multipath a bit to fail all IO to a new path that is working.<br>
><br>
> Is there any information that might be useful for me that I can check on<br>
> either the multipath side or the iSCSI side to see what is causing the<br>
> issue???<br>
><br>
<br>
</div></div>What iscsi driver are you using? If you are using software iscsi that<br>
comes with OEL 5.8 what are our node.session.timeo.replacement_timeout,<br>
.timeo.noop_out_timeout and .timeo.noop_out_interval. And what is your<br>
scsi command timeout. You can see that by doing:<br>
<br>
cat /sys/block/sdX/device/timeout<br>
<br>
<br>
</blockquote></div><br></div>