<div dir="ltr">Grabbing Mikes latest combined tree and testing it now<div><br></div><div>Thanks</div><div>Laurence</div></div><div class="gmail_extra"><br><div class="gmail_quote">On Wed, Jan 17, 2018 at 6:57 PM, Laurence Oberman <span dir="ltr"><<a href="mailto:loberman@redhat.com" target="_blank">loberman@redhat.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div class="HOEnZb"><div class="h5">On Wed, 2018-01-17 at 23:53 +0000, Bart Van Assche wrote:<br>
> On Wed, 2018-01-17 at 18:43 -0500, Laurence Oberman wrote:<br>
> > On Wed, 2018-01-17 at 23:31 +0000, Bart Van Assche wrote:<br>
> > > On Wed, 2018-01-17 at 11:58 -0500, Mike Snitzer wrote:<br>
> > > > On Wed, Jan 17 2018 at 11:50am -0500,<br>
> > > > Jens Axboe <<a href="mailto:axboe@kernel.dk">axboe@kernel.dk</a>> wrote:<br>
> > > ><br>
> > > > > On 1/17/18 9:25 AM, Mike Snitzer wrote:<br>
> > > > > > Hi Jens,<br>
> > > > > ><br>
> > > > > > Think this finally takes care of it! ;)<br>
> > > > > ><br>
> > > > > > Thanks,<br>
> > > > > > Mike<br>
> > > > > ><br>
> > > > > > Mike Snitzer (2):<br>
> > > > > >   blk-mq: factor out a few helpers from<br>
> > > > > > __blk_mq_try_issue_directly<br>
> > > > > >   blk-mq-sched: remove unused 'can_block' arg from<br>
> > > > > > blk_mq_sched_insert_request<br>
> > > > > ><br>
> > > > > > Ming Lei (1):<br>
> > > > > >   blk-mq: improve DM's blk-mq IO merging via<br>
> > > > > > blk_insert_cloned_request feedback<br>
> > > > ><br>
> > > > > Applied - added actual commit message to patch 3.<br>
> > > ><br>
> > > > Great, thanks.<br>
> > ><br>
> > > Hello Mike,<br>
> > ><br>
> > > Laurence hit the following while retesting the SRP initiator<br>
> > > code:<br>
> > ><br>
> > > [ 2223.797129] list_add corruption. prev->next should be next<br>
> > > (00000000e0ddd5dd), but was 000000003defe5cd.<br>
> > > (prev=000000003defe5cd).<br>
> > > [ 2223.862168] WARNING: CPU: 14 PID: 577 at lib/list_debug.c:28<br>
> > > __list_add_valid+0x6a/0x70<br>
> > > [ 2224.481151] CPU: 14 PID: 577 Comm: kworker/14:1H Tainted:<br>
> > > G          I      4.15.0-rc8.<wbr>bart3+ #1<br>
> > > [ 2224.531193] Hardware name: HP ProLiant DL380 G7, BIOS P67<br>
> > > 08/16/2015<br>
> > > [ 2224.567150] Workqueue: kblockd blk_mq_run_work_fn<br>
> > > [ 2224.593182] RIP: 0010:__list_add_valid+0x6a/<wbr>0x70<br>
> > > [ 2224.967002] Call Trace:<br>
> > > [ 2224.980941]  blk_mq_request_<wbr>bypass_insert+0x57/0xa0<br>
> > > [ 2225.009044]  __blk_mq_try_<wbr>issue_directly+0x56/0x1e0<br>
> > > [ 2225.037007]  blk_mq_request_<wbr>direct_issue+0x5d/0xc0<br>
> > > [ 2225.090608]  map_request+<wbr>0x142/0x260 [dm_mod]<br>
> > > [ 2225.114756]  dm_mq_queue_rq+<wbr>0xa4/0x120 [dm_mod]<br>
> > > [ 2225.140812]  blk_mq_dispatch_<wbr>rq_list+0x90/0x5b0<br>
> > > [ 2225.211769]  blk_mq_sched_<wbr>dispatch_requests+0x107/0x1a0<br>
> > > [ 2225.240825]  __blk_mq_run_hw_<wbr>queue+0x5f/0xf0<br>
> > > [ 2225.264852]  process_one_<wbr>work+0x141/0x340<br>
> > > [ 2225.287872]  worker_thread+<wbr>0x47/0x3e0<br>
> > > [ 2225.308354]  kthread+0xf5/<wbr>0x130<br>
> > > [ 2225.396405]  ret_from_fork+<wbr>0x32/0x40<br>
> > ><br>
> > > That call trace did not show up before this patch series was<br>
> > > added to<br>
> > > Jens'<br>
> > > tree. This is a regression. Could this have been introduced by<br>
> > > this<br>
> > > patch<br>
> > > series?<br>
> > ><br>
> > > Thanks,<br>
> > ><br>
> > > Bart.<br>
> ><br>
> > Hi Bart<br>
> > One thing to note.<br>
> ><br>
> > I tested Mike's combined tree on the weekend fully dm4.16-block4.16<br>
> > and<br>
> > did not see this.<br>
> > This was with Mike combined tree and SRPT running 4.13-rc2.<br>
> ><br>
> > I also tested your tree Monday with the revert of the<br>
> > scatter/gather<br>
> > patches with both SRP and SRPT running your tree and it was fine.<br>
> ><br>
> > So its a combination of what you provided me before and that has<br>
> > been<br>
> > added to your tree.<br>
> ><br>
> > Mike combined tree seemed to be fine, I can revisit that if needed.<br>
> > I<br>
> > still have that kernel in place.<br>
> ><br>
> > I was not running latest SRPT when I tested Mike's tree<br>
><br>
> Hello Laurence,<br>
><br>
> The tree I sent you this morning did not only include Mike's latest<br>
> dm code<br>
> but also Jens' latest for-next branch. So what you wrote above does<br>
> not<br>
> contradict what I wrote in my e-mail, namely that I suspect that a<br>
> regression<br>
> was introduced by the patches in the series "blk-mq: improve DM's<br>
> blk-mq IO<br>
> merging via blk_insert_cloned_request feedback". These changes namely<br>
> went in<br>
> through the block tree and not through the dm tree. Additionally,<br>
> these<br>
> changes were not present in the block-scsi-for-next branch I sent you<br>
> on<br>
> Monday.<br>
><br>
> Bart.<br>
<br>
</div></div>Hi Bart<br>
Thank you<br>
<br>
I probably don't have latest stuff Mike added Monday in his tree.<br>
I have not gone back to test that, been busy with yours all week.<br>
<br>
I will get with Mike and pull his latest and test it with SRPT on 4.13-<br>
rc2 like before.<br>
<br>
That should be the best way to isolate this.<br>
<br>
Regards<br>
<span class="HOEnZb"><font color="#888888">Laurence<br>
</font></span></blockquote></div><br></div>