<div dir="ltr">MIke and Bart<div><br><div>Replying via Browser because Evolution is having issues so cannot copy the block list.</div><div>The gmail browser wont do clean text, only evolution for me.</div><div><br></div><div>Server is running 4.13-rc1 for the RPT so stayed up, Client see sthe list corruption like I saw on Barts tree.</div><div>Someone will have to copy the block list if needed until I get evolution back<br></div><div><br></div><div><div>[  370.765953] list_add corruption. prev->next should be next (0000000062acf0b0), but was 000000007a44ce4f. (prev=000000007a44ce4f).</div><div>[  370.831948] WARNING: CPU: 15 PID: 13175 at lib/list_debug.c:28 __list_add_valid+0x6a/0x70</div><div>[  370.877893] Modules linked in: xt_CHECKSUM iptable_mangle ipt_MASQUERADE nf_nat_masquerade_ipv4 iptable_nat nf_nat_ipv4 nf_nat nf_conntrack_ipv4 nf_defrag_ipv4 xt_conntrack nf_conntrack ipt_REJECT nf_reject_ipv4 tun bridge stp llc ebtable_filter ebtables ip6table_filter ip6_tables iptable_filter rpcrdma ib_isert iscsi_target_mod target_core_mod ib_iser libiscsi scsi_transport_iscsi ib_srp scsi_transport_srp ib_ipoib rdma_ucm ib_ucm ib_uverbs ib_umad rdma_cm ib_cm iw_cm mlx5_ib ib_core intel_powerclamp coretemp kvm_intel kvm irqbypass crct10dif_pclmul crc32_pclmul ipmi_ssif ghash_clmulni_intel pcbc aesni_intel crypto_simd ipmi_si glue_helper cryptd joydev ipmi_devintf ipmi_msghandler iTCO_wdt iTCO_vendor_support dm_service_time pcspkr acpi_power_meter gpio_ich hpilo hpwdt sg pcc_cpufreq i7core_edac</div><div>[  371.273754]  shpchp lpc_ich nfsd auth_rpcgss nfs_acl lockd grace dm_multipath sunrpc ip_tables xfs libcrc32c sd_mod radeon mlx5_core i2c_algo_bit drm_kms_helper syscopyarea sysfillrect sysimgblt fb_sys_fops ttm mlxfw drm ptp i2c_core crc32c_intel hpsa pps_core serio_raw bnx2 devlink scsi_transport_sas dm_mirror dm_region_hash dm_log dm_mod</div><div>[  371.444895] CPU: 15 PID: 13175 Comm: kworker/u66:14 Tainted: G          I      4.15.0-rc4.dm_and_block+ #1</div><div>[  371.499292] Hardware name: HP ProLiant DL380 G7, BIOS P67 08/16/2015</div><div>[  371.535070] Workqueue: writeback wb_workfn (flush-253:13)</div><div>[  371.565729] RIP: 0010:__list_add_valid+0x6a/0x70</div><div>[  371.592197] RSP: 0018:ffffae5b8c293690 EFLAGS: 00010286</div><div>[  371.621114] RAX: 0000000000000000 RBX: ffff929ba920b800 RCX: 0000000000000000</div><div>[  371.661131] RDX: 0000000000000001 RSI: ffff929c333cdf78 RDI: ffff929c333cdf78</div><div>[  371.702111] RBP: ffff929ba8b34c00 R08: 0000000000000000 R09: 00000000000006d7</div><div>[  371.743248] R10: 0000000000000000 R11: ffffae5b8c2933f8 R12: ffff929ba8b34c40</div><div>[  371.783772] R13: ffff929ba8b34c40 R14: ffff929ba920b808 R15: 0000000000000001</div><div>[  371.824291] FS:  0000000000000000(0000) GS:ffff929c333c0000(0000) knlGS:0000000000000000</div><div>[  371.870706] CS:  0010 DS: 0000 ES: 0000 CR0: 0000000080050033</div><div>[  371.903803] CR2: 00007fb07e09b000 CR3: 0000000f56609006 CR4: 00000000000206e0</div><div>[  371.943875] Call Trace:</div><div>[  371.957310]  blk_mq_request_bypass_insert+0x57/0xa0</div><div>[  371.984333]  __blk_mq_try_issue_directly+0x56/0x1e0</div><div>[  372.011390]  blk_mq_request_direct_issue+0x5d/0xc0</div><div>[  372.038404]  ? blk_insert_cloned_request+0x96/0x1c0</div><div>[  372.065923]  map_request+0x142/0x260 [dm_mod]</div><div>[  372.090043]  dm_mq_queue_rq+0xa4/0x120 [dm_mod]</div><div>[  372.115507]  blk_mq_dispatch_rq_list+0x8e/0x530</div><div>[  372.141076]  ? deadline_remove_request+0x79/0xc0</div><div>[  372.167035]  blk_mq_do_dispatch_sched+0x8b/0x110</div><div>[  372.192938]  blk_mq_sched_dispatch_requests+0x118/0x1a0</div><div>[  372.222326]  __blk_mq_run_hw_queue+0x5f/0xf0</div><div>[  372.246083]  __blk_mq_delay_run_hw_queue+0x9c/0xa0</div><div>[  372.272943]  blk_mq_run_hw_queue+0x54/0xf0</div><div>[  372.296181]  blk_mq_flush_plug_list+0x17f/0x260</div><div>[  372.322152]  blk_flush_plug_list+0xe4/0x260</div><div>[  372.345712]  blk_mq_make_request+0x483/0x560</div><div>[  372.370156]  generic_make_request+0x110/0x2e0</div><div>[  372.394759]  submit_bio+0x6e/0x140</div><div>[  372.414258]  xfs_submit_ioend+0x9c/0x110 [xfs]</div><div>[  372.439759]  xfs_vm_writepages+0xc6/0xd0 [xfs]</div><div>[  372.464677]  do_writepages+0x17/0x70</div><div>[  372.484686]  __writeback_single_inode+0x3d/0x330</div><div>[  372.510219]  writeback_sb_inodes+0x24f/0x4b0</div><div>[  372.534789]  __writeback_inodes_wb+0x87/0xb0</div><div>[  372.558826]  wb_writeback+0x276/0x310</div><div>[  372.579434]  wb_workfn+0x1b0/0x460</div><div>[  372.598886]  process_one_work+0x141/0x340</div><div>[  372.621522]  worker_thread+0x47/0x3e0</div><div>[  372.641939]  kthread+0xf5/0x130</div><div>[  372.659890]  ? rescuer_thread+0x380/0x380</div><div>[  372.682932]  ? kthread_associate_blkcg+0x90/0x90</div><div>[  372.708925]  ret_from_fork+0x1f/0x30</div><div>[  372.729339] Code: fe 31 c0 48 c7 c7 58 a8 c9 ba e8 02 4c cf ff 0f ff 31 c0 c3 48 89 d1 48 c7 c7 08 a8 c9 ba 48 89 f2 48 89 c6 31 c0 e8 e6 4b cf ff <0f> ff 31 c0 c3 90 48 8b 07 48 b9 00 01 00 00 00 00 ad de 48 8b </div><div>[  372.835562] ---[ end trace d6ddd485d92c6ddd ]---</div><div><br></div><div>[  372.861081] scsi host1: ib_srp: Failed to map data (-5)    Note</div><div><br></div><div>[  372.863116] WARNING: CPU: 15 PID: 13175 at block/blk-mq.c:667 blk_mq_start_request+0x161/0x170</div><div>[  372.863117] Modules linked in: xt_CHECKSUM iptable_mangle ipt_MASQUERADE nf_nat_masquerade_ipv4 iptable_nat nf_nat_ipv4 nf_nat nf_conntrack_ipv4 nf_defrag_ipv4 xt_conntrack nf_conntrack ipt_REJECT nf_reject_ipv4 tun bridge stp llc ebtable_filter ebtables ip6table_filter ip6_tables iptable_filter rpcrdma ib_isert iscsi_target_mod target_core_mod ib_iser libiscsi scsi_transport_iscsi ib_srp scsi_transport_srp ib_ipoib rdma_ucm ib_ucm ib_uverbs ib_umad rdma_cm ib_cm iw_cm mlx5_ib ib_core intel_powerclamp coretemp kvm_intel kvm irqbypass crct10dif_pclmul crc32_pclmul ipmi_ssif ghash_clmulni_intel pcbc aesni_intel crypto_simd ipmi_si glue_helper cryptd joydev ipmi_devintf ipmi_msghandler iTCO_wdt iTCO_vendor_support dm_service_time pcspkr acpi_power_meter gpio_ich hpilo hpwdt sg pcc_cpufreq i7core_edac</div><div>[  372.863147]  shpchp lpc_ich nfsd auth_rpcgss nfs_acl lockd grace dm_multipath sunrpc ip_tables xfs libcrc32c sd_mod radeon mlx5_core i2c_algo_bit drm_kms_helper syscopyarea sysfillrect sysimgblt fb_sys_fops ttm mlxfw drm ptp i2c_core crc32c_intel hpsa pps_core serio_raw bnx2 devlink scsi_transport_sas dm_mirror dm_region_hash dm_log dm_mod</div><div>[  372.863165] CPU: 15 PID: 13175 Comm: kworker/u66:14 Tainted: G        W I      4.15.0-rc4.dm_and_block+ #1</div><div>[  372.863166] Hardware name: HP ProLiant DL380 G7, BIOS P67 08/16/2015</div><div>[  372.863170] Workqueue: writeback wb_workfn (flush-253:13)</div><div>[  372.863173] RIP: 0010:blk_mq_start_request+0x161/0x170</div><div>[  372.863174] RSP: 0018:ffffae5b8c293480 EFLAGS: 00010202</div><div>[  372.863177] RAX: 0000000000000009 RBX: ffff929ba8b34c00 RCX: 0001ffffffffffff</div><div>[  372.863179] RDX: 00000056af18c440 RSI: 00310d51549749a3 RDI: ffffffffbae29760</div><div>[  372.863180] RBP: 0000000000000000 R08: 0000000000000000 R09: ffff929ba8b34d98</div><div>[  372.863182] R10: 0000000000001000 R11: 0000000000000000 R12: ffff929ba8cdcba8</div><div>[  372.863183] R13: 0000000000004000 R14: ffff929ba920b800 R15: ffff929ba8b34d60</div><div>[  372.863185] FS:  0000000000000000(0000) GS:ffff929c333c0000(0000) knlGS:0000000000000000</div><div>[  372.863187] CS:  0010 DS: 0000 ES: 0000 CR0: 0000000080050033</div><div>[  372.863188] CR2: 00007fb07e09b000 CR3: 0000000f56609006 CR4: 00000000000206e0</div><div>[  372.863189] Call Trace:</div><div>[  372.863200]  scsi_queue_rq+0x2f4/0x560</div><div>[  372.863202]  ? scsi_mq_get_budget+0x31/0x110</div><div>[  372.863205]  __blk_mq_try_issue_directly+0x195/0x1e0</div><div>[  372.863206]  blk_mq_request_direct_issue+0x5d/0xc0</div><div>[  372.863209]  ? blk_insert_cloned_request+0x96/0x1c0</div><div>[  372.863221]  map_request+0x142/0x260 [dm_mod]</div><div>[  372.863226]  dm_mq_queue_rq+0xa4/0x120 [dm_mod]</div><div>[  372.863229]  blk_mq_dispatch_rq_list+0x8e/0x530</div><div>[  372.863233]  ? deadline_remove_request+0x79/0xc0</div><div>[  372.863236]  blk_mq_do_dispatch_sched+0x8b/0x110</div><div>[  372.863239]  blk_mq_sched_dispatch_requests+0x118/0x1a0</div><div>[  372.863241]  __blk_mq_run_hw_queue+0x5f/0xf0</div><div>[  372.863243]  __blk_mq_delay_run_hw_queue+0x9c/0xa0</div><div>[  372.863245]  blk_mq_run_hw_queue+0x54/0xf0</div><div>[  372.863248]  blk_mq_flush_plug_list+0x17f/0x260</div><div>[  372.863250]  blk_flush_plug_list+0xe4/0x260</div><div>[  372.863252]  blk_mq_make_request+0x483/0x560</div><div>[  372.863254]  generic_make_request+0x110/0x2e0</div><div>[  372.863257]  submit_bio+0x6e/0x140</div><div>[  372.863333]  xfs_add_to_ioend+0x13f/0x240 [xfs]</div><div>[  372.863364]  ? xfs_map_buffer.isra.14+0x33/0x60 [xfs]</div><div>[  372.863397]  xfs_do_writepage+0x214/0x600 [xfs]</div><div>[  372.863403]  ? find_get_pages_range_tag+0x15f/0x290</div><div>[  372.863407]  ? invalid_page_referenced_vma+0x90/0x90</div><div>[  372.863410]  write_cache_pages+0x222/0x470</div><div>[  372.863439]  ? xfs_aops_discard_page+0x130/0x130 [xfs]</div><div>[  372.863469]  xfs_vm_writepages+0xb2/0xd0 [xfs]</div><div>[  372.863473]  do_writepages+0x17/0x70</div><div>[  372.863475]  __writeback_single_inode+0x3d/0x330</div><div>[  372.863477]  writeback_sb_inodes+0x24f/0x4b0</div><div>[  372.863479]  __writeback_inodes_wb+0x87/0xb0</div><div>[  372.863481]  wb_writeback+0x276/0x310</div><div>[  372.863483]  wb_workfn+0x1b0/0x460</div><div>[  372.863489]  process_one_work+0x141/0x340</div><div>[  372.863491]  worker_thread+0x47/0x3e0</div><div>[  372.863494]  kthread+0xf5/0x130</div><div>[  372.863497]  ? rescuer_thread+0x380/0x380</div><div>[  372.863499]  ? kthread_associate_blkcg+0x90/0x90</div><div>[  372.863504]  ret_from_fork+0x1f/0x30</div><div>[  372.863506] Code: ed 09 48 21 c8 44 89 ea 81 e2 ff 0f 00 00 48 c1 e2 31 48 09 ea 48 09 c2 48 89 93 b0 00 00 00 e9 ea fe ff ff 0f ff e9 14 ff ff ff <0f> ff e9 eb fe ff ff 0f 1f 84 00 00 00 00 00 66 66 66 66 90 48 </div><div>[  372.863523] ---[ end trace d6ddd485d92c6dde ]---</div><div>[  372.863536] WARNING: CPU: 15 PID: 13175 at block/blk-mq.h:128 blk_mq_start_request+0x15a/0x170</div><div>[  372.863537] Modules linked in: xt_CHECKSUM iptable_mangle ipt_MASQUERADE nf_nat_masquerade_ipv4 iptable_nat nf_nat_ipv4 nf_nat nf_conntrack_ipv4 nf_defrag_ipv4 xt_conntrack nf_conntrack ipt_REJECT nf_reject_ipv4 tun bridge stp llc ebtable_filter ebtables ip6table_filter ip6_tables iptable_filter rpcrdma ib_isert iscsi_target_mod target_core_mod ib_iser libiscsi scsi_transport_iscsi ib_srp scsi_transport_srp ib_ipoib rdma_ucm ib_ucm ib_uverbs ib_umad rdma_cm ib_cm iw_cm mlx5_ib ib_core intel_powerclamp coretemp kvm_intel kvm irqbypass crct10dif_pclmul crc32_pclmul ipmi_ssif ghash_clmulni_intel pcbc aesni_intel crypto_simd ipmi_si glue_helper cryptd joydev ipmi_devintf ipmi_msghandler iTCO_wdt iTCO_vendor_support dm_service_time pcspkr acpi_power_meter gpio_ich hpilo hpwdt sg pcc_cpufreq i7core_edac</div><div>[  372.863557]  shpchp lpc_ich nfsd auth_rpcgss nfs_acl lockd grace dm_multipath sunrpc ip_tables xfs libcrc32c sd_mod radeon mlx5_core i2c_algo_bit drm_kms_helper syscopyarea sysfillrect sysimgblt fb_sys_fops ttm mlxfw drm ptp i2c_core crc32c_intel hpsa pps_core serio_raw bnx2 devlink scsi_transport_sas dm_mirror dm_region_hash dm_log dm_mod</div><div>[  372.863568] CPU: 15 PID: 13175 Comm: kworker/u66:14 Tainted: G        W I      4.15.0-rc4.dm_and_block+ #1</div><div>[  372.863569] Hardware name: HP ProLiant DL380 G7, BIOS P67 08/16/2015</div><div>[  372.863571] Workqueue: writeback wb_workfn (flush-253:13)</div><div>[  372.863573] RIP: 0010:blk_mq_start_request+0x15a/0x170</div><div>[  372.863574] RSP: 0018:ffffae5b8c293480 EFLAGS: 00010202</div><div>[  372.863576] RAX: 0000000000000009 RBX: ffff929ba8b34c00 RCX: 0001ffffffffffff</div><div>[  372.863577] RDX: 0000000000000001 RSI: 00310d51549749a3 RDI: ffffffffbae29760</div><div>[  372.863578] RBP: 0000000000000000 R08: 0000000000000000 R09: ffff929ba8b34d98</div><div>[  372.863579] R10: 0000000000001000 R11: 0000000000000000 R12: ffff929ba8cdcba8</div><div>[  372.863580] R13: 0000000000004000 R14: ffff929ba920b800 R15: ffff929ba8b34d60</div><div>[  372.863582] FS:  0000000000000000(0000) GS:ffff929c333c0000(0000) knlGS:0000000000000000</div><div>[  372.863584] CS:  0010 DS: 0000 ES: 0000 CR0: 0000000080050033</div><div>[  372.863585] CR2: 00007fb07e09b000 CR3: 0000000f56609006 CR4: 00000000000206e0</div><div>[  372.863587] Call Trace:</div><div>[  372.863589]  scsi_queue_rq+0x2f4/0x560</div><div>[  372.863591]  ? scsi_mq_get_budget+0x31/0x110</div><div>[  372.863593]  __blk_mq_try_issue_directly+0x195/0x1e0</div><div>[  372.863595]  blk_mq_request_direct_issue+0x5d/0xc0</div><div>[  372.863598]  ? blk_insert_cloned_request+0x96/0x1c0</div><div>[  372.863604]  map_request+0x142/0x260 [dm_mod]</div><div>[  372.863609]  dm_mq_queue_rq+0xa4/0x120 [dm_mod]</div><div>[  372.863611]  blk_mq_dispatch_rq_list+0x8e/0x530</div><div>[  372.863614]  ? deadline_remove_request+0x79/0xc0</div><div>[  372.863617]  blk_mq_do_dispatch_sched+0x8b/0x110</div><div>[  372.863619]  blk_mq_sched_dispatch_requests+0x118/0x1a0</div><div>[  372.863622]  __blk_mq_run_hw_queue+0x5f/0xf0</div><div>[  372.863625]  __blk_mq_delay_run_hw_queue+0x9c/0xa0</div><div>[  372.863627]  blk_mq_run_hw_queue+0x54/0xf0</div><div>[  372.863628]  blk_mq_flush_plug_list+0x17f/0x260</div><div>[  372.863630]  blk_flush_plug_list+0xe4/0x260</div><div>[  372.863632]  blk_mq_make_request+0x483/0x560</div><div>[  372.863634]  generic_make_request+0x110/0x2e0</div><div>[  372.863635]  submit_bio+0x6e/0x140</div><div>[  372.863664]  xfs_add_to_ioend+0x13f/0x240 [xfs]</div><div>[  372.863694]  ? xfs_map_buffer.isra.14+0x33/0x60 [xfs]</div><div>[  372.863724]  xfs_do_writepage+0x214/0x600 [xfs]</div><div>[  372.863727]  ? find_get_pages_range_tag+0x15f/0x290</div><div>[  372.863730]  ? invalid_page_referenced_vma+0x90/0x90</div><div>[  372.863732]  write_cache_pages+0x222/0x470</div><div>[  372.863762]  ? xfs_aops_discard_page+0x130/0x130 [xfs]</div><div>[  372.863791]  xfs_vm_writepages+0xb2/0xd0 [xfs]</div><div>[  372.863794]  do_writepages+0x17/0x70</div><div>[  372.863796]  __writeback_single_inode+0x3d/0x330</div><div>[  372.863799]  writeback_sb_inodes+0x24f/0x4b0</div><div>[  372.863801]  __writeback_inodes_wb+0x87/0xb0</div><div>[  372.863804]  wb_writeback+0x276/0x310</div><div>[  372.863806]  wb_workfn+0x1b0/0x460</div><div>[  372.863809]  process_one_work+0x141/0x340</div><div>[  372.863812]  worker_thread+0x47/0x3e0</div><div>[  372.863814]  kthread+0xf5/0x130</div><div>[  372.863817]  ? rescuer_thread+0x380/0x380</div><div>[  372.863820]  ? kthread_associate_blkcg+0x90/0x90</div><div>[  372.863822]  ret_from_fork+0x1f/0x30</div><div>[  372.863823] Code: 18 00 00 02 00 41 c1 ed 09 48 21 c8 44 89 ea 81 e2 ff 0f 00 00 48 c1 e2 31 48 09 ea 48 09 c2 48 89 93 b0 00 00 00 e9 ea fe ff ff <0f> ff e9 14 ff ff ff 0f ff e9 eb fe ff ff 0f 1f 84 00 00 00 00 </div><div>[  372.863841] ---[ end trace d6ddd485d92c6ddf ]---</div><div>[  372.915387] ------------[ cut here ]------------</div><div>[  372.915391] list_add corruption. prev->next should be next (00000000bebab7ca), but was 00000000b1199db9. (prev=00000000b1199db9).</div><div>[  372.915416] WARNING: CPU: 15 PID: 13175 at lib/list_debug.c:28 __list_add_valid+0x6a/0x70</div><div>[  372.915417] Modules linked in: xt_CHECKSUM iptable_mangle ipt_MASQUERADE nf_nat_masquerade_ipv4 iptable_nat nf_nat_ipv4 nf_nat nf_conntrack_ipv4 nf_defrag_ipv4 xt_conntrack nf_conntrack ipt_REJECT nf_reject_ipv4 tun bridge stp llc ebtable_filter ebtables ip6table_filter ip6_tables iptable_filter rpcrdma ib_isert iscsi_target_mod target_core_mod ib_iser libiscsi scsi_transport_iscsi ib_srp scsi_transport_srp ib_ipoib rdma_ucm ib_ucm ib_uverbs ib_umad rdma_cm ib_cm iw_cm mlx5_ib ib_core intel_powerclamp coretemp kvm_intel kvm irqbypass crct10dif_pclmul crc32_pclmul ipmi_ssif ghash_clmulni_intel pcbc aesni_intel crypto_simd ipmi_si glue_helper cryptd joydev ipmi_devintf ipmi_msghandler iTCO_wdt iTCO_vendor_support dm_service_time pcspkr acpi_power_meter gpio_ich hpilo hpwdt sg pcc_cpufreq i7core_edac</div><div>[  372.915454]  shpchp lpc_ich nfsd auth_rpcgss nfs_acl lockd grace dm_multipath sunrpc ip_tables xfs libcrc32c sd_mod radeon mlx5_core i2c_algo_bit drm_kms_helper syscopyarea sysfillrect sysimgblt fb_sys_fops ttm mlxfw drm ptp i2c_core crc32c_intel hpsa pps_core serio_raw bnx2 devlink scsi_transport_sas dm_mirror dm_region_hash dm_log dm_mod</div><div>[  372.915473] CPU: 15 PID: 13175 Comm: kworker/u66:14 Tainted: G        W I      4.15.0-rc4.dm_and_block+ #1</div><div>[  372.915473] Hardware name: HP ProLiant DL380 G7, BIOS P67 08/16/2015</div><div>[  372.915478] Workqueue: writeback wb_workfn (flush-253:13)</div><div>[  372.915481] RIP: 0010:__list_add_valid+0x6a/0x70</div><div>[  372.915482] RSP: 0018:ffffae5b8c2934b0 EFLAGS: 00010282</div><div>[  372.915484] RAX: 0000000000000000 RBX: ffff929c2bb83000 RCX: 0000000000000000</div><div>[  372.915485] RDX: 0000000000000001 RSI: 0000000000000002 RDI: 0000000000000282</div><div>[  372.915487] RBP: ffff929ba87ed100 R08: 0000000000000075 R09: ffff929c6402cfdd</div><div>[  372.915487] R10: 0000000000000780 R11: 0000000000000000 R12: ffff929ba87ed140</div><div>[  372.915489] R13: ffff929ba87ed140 R14: ffff929c2bb83008 R15: 0000000000000001</div><div>[  372.915491] FS:  0000000000000000(0000) GS:ffff929c333c0000(0000) knlGS:0000000000000000</div><div>[  372.915492] CS:  0010 DS: 0000 ES: 0000 CR0: 0000000080050033</div><div>[  372.915493] CR2: 00007fb07e09b000 CR3: 0000000f56609006 CR4: 00000000000206e0</div><div>[  372.915494] Call Trace:</div><div>[  372.915500]  blk_mq_request_bypass_insert+0x57/0xa0</div><div>[  372.915503]  __blk_mq_try_issue_directly+0x56/0x1e0</div><div>[  372.915504]  blk_mq_request_direct_issue+0x5d/0xc0</div><div>[  372.915507]  ? blk_insert_cloned_request+0x96/0x1c0</div><div>[  372.915517]  map_request+0x142/0x260 [dm_mod]</div><div>[  372.915522]  dm_mq_queue_rq+0xa4/0x120 [dm_mod]</div><div>[  372.915525]  blk_mq_dispatch_rq_list+0x8e/0x530</div><div>[  372.915528]  ? deadline_remove_request+0x79/0xc0</div><div>[  372.915531]  blk_mq_do_dispatch_sched+0x8b/0x110</div><div>[  372.915534]  blk_mq_sched_dispatch_requests+0x118/0x1a0</div><div>[  372.915538]  __blk_mq_run_hw_queue+0x5f/0xf0</div><div>[  372.915540]  __blk_mq_delay_run_hw_queue+0x9c/0xa0</div><div>[  372.915542]  blk_mq_run_hw_queue+0x54/0xf0</div><div>[  372.915544]  blk_mq_flush_plug_list+0x17f/0x260</div><div>[  372.915547]  blk_flush_plug_list+0xe4/0x260</div><div>[  372.915550]  blk_mq_make_request+0x483/0x560</div><div>[  372.915553]  generic_make_request+0x110/0x2e0</div><div>[  372.915555]  submit_bio+0x6e/0x140</div><div>[  372.915608]  xfs_add_to_ioend+0x13f/0x240 [xfs]</div><div>[  372.915639]  ? xfs_map_buffer.isra.14+0x33/0x60 [xfs]</div><div>[  372.915667]  xfs_do_writepage+0x214/0x600 [xfs]</div><div>[  372.915673]  ? find_get_pages_range_tag+0x15f/0x290</div><div>[  372.915677]  ? invalid_page_referenced_vma+0x90/0x90</div><div>[  372.915680]  write_cache_pages+0x222/0x470</div><div>[  372.915709]  ? xfs_aops_discard_page+0x130/0x130 [xfs]</div><div>[  372.915739]  xfs_vm_writepages+0xb2/0xd0 [xfs]</div><div>[  372.915743]  do_writepages+0x17/0x70</div><div>[  372.915745]  __writeback_single_inode+0x3d/0x330</div><div>[  372.915746]  writeback_sb_inodes+0x24f/0x4b0</div><div>[  372.915749]  __writeback_inodes_wb+0x87/0xb0</div><div>[  372.915751]  wb_writeback+0x276/0x310</div><div>[  372.915753]  wb_workfn+0x1b0/0x460</div><div>[  372.915758]  process_one_work+0x141/0x340</div><div>[  372.915761]  worker_thread+0x47/0x3e0</div><div>[  372.915764]  kthread+0xf5/0x130</div><div>[  372.915766]  ? rescuer_thread+0x380/0x380</div><div>[  372.915769]  ? kthread_associate_blkcg+0x90/0x90</div><div>[  372.915774]  ret_from_fork+0x1f/0x30</div><div>[  372.915775] Code: fe 31 c0 48 c7 c7 58 a8 c9 ba e8 02 4c cf ff 0f ff 31 c0 c3 48 89 d1 48 c7 c7 08 a8 c9 ba 48 89 f2 48 89 c6 31 c0 e8 e6 4b cf ff <0f> ff 31 c0 c3 90 48 8b 07 48 b9 00 01 00 00 00 00 ad de 48 8b </div><div>[  372.915792] ---[ end trace d6ddd485d92c6de0 ]---</div><div>[  372.916492] ------------[ cut here ]------------</div><div>[  372.916493] list_add corruption. prev->next should be next (00000000bebab7ca), but was 00000000b1199db9. (prev=00000000b1199db9).</div><div>[  372.916501] WARNING: CPU: 15 PID: 13175 at lib/list_debug.c:28 __list_add_valid+0x6a/0x70</div></div><div><br></div><div><br></div><div><br></div><div><br></div><div><br></div></div></div><div class="gmail_extra"><br><div class="gmail_quote">On Wed, Jan 17, 2018 at 7:54 PM, Mike Snitzer <span dir="ltr"><<a href="mailto:snitzer@redhat.com" target="_blank">snitzer@redhat.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div class="HOEnZb"><div class="h5">On Wed, Jan 17 2018 at  6:53pm -0500,<br>
Bart Van Assche <<a href="mailto:Bart.VanAssche@wdc.com">Bart.VanAssche@wdc.com</a>> wrote:<br>
<br>
> On Wed, 2018-01-17 at 18:43 -0500, Laurence Oberman wrote:<br>
> > On Wed, 2018-01-17 at 23:31 +0000, Bart Van Assche wrote:<br>
> > > On Wed, 2018-01-17 at 11:58 -0500, Mike Snitzer wrote:<br>
> > > > On Wed, Jan 17 2018 at 11:50am -0500,<br>
> > > > Jens Axboe <<a href="mailto:axboe@kernel.dk">axboe@kernel.dk</a>> wrote:<br>
> > > ><br>
> > > > > On 1/17/18 9:25 AM, Mike Snitzer wrote:<br>
> > > > > > Hi Jens,<br>
> > > > > ><br>
> > > > > > Think this finally takes care of it! ;)<br>
> > > > > ><br>
> > > > > > Thanks,<br>
> > > > > > Mike<br>
> > > > > ><br>
> > > > > > Mike Snitzer (2):<br>
> > > > > >   blk-mq: factor out a few helpers from<br>
> > > > > > __blk_mq_try_issue_directly<br>
> > > > > >   blk-mq-sched: remove unused 'can_block' arg from<br>
> > > > > > blk_mq_sched_insert_request<br>
> > > > > ><br>
> > > > > > Ming Lei (1):<br>
> > > > > >   blk-mq: improve DM's blk-mq IO merging via<br>
> > > > > > blk_insert_cloned_request feedback<br>
> > > > ><br>
> > > > > Applied - added actual commit message to patch 3.<br>
> > > ><br>
> > > > Great, thanks.<br>
> > ><br>
> > > Hello Mike,<br>
> > ><br>
> > > Laurence hit the following while retesting the SRP initiator code:<br>
> > ><br>
> > > [ 2223.797129] list_add corruption. prev->next should be next<br>
> > > (00000000e0ddd5dd), but was 000000003defe5cd.<br>
> > > (prev=000000003defe5cd).<br>
> > > [ 2223.862168] WARNING: CPU: 14 PID: 577 at lib/list_debug.c:28<br>
> > > __list_add_valid+0x6a/0x70<br>
> > > [ 2224.481151] CPU: 14 PID: 577 Comm: kworker/14:1H Tainted:<br>
> > > G          I      4.15.0-rc8.bart3+ #1<br>
> > > [ 2224.531193] Hardware name: HP ProLiant DL380 G7, BIOS P67<br>
> > > 08/16/2015<br>
> > > [ 2224.567150] Workqueue: kblockd blk_mq_run_work_fn<br>
> > > [ 2224.593182] RIP: 0010:__list_add_valid+0x6a/<wbr>0x70<br>
> > > [ 2224.967002] Call Trace:<br>
> > > [ 2224.980941]  blk_mq_request_bypass_insert+<wbr>0x57/0xa0<br>
> > > [ 2225.009044]  __blk_mq_try_issue_directly+<wbr>0x56/0x1e0<br>
> > > [ 2225.037007]  blk_mq_request_direct_issue+<wbr>0x5d/0xc0<br>
> > > [ 2225.090608]  map_request+0x142/0x260 [dm_mod]<br>
> > > [ 2225.114756]  dm_mq_queue_rq+0xa4/0x120 [dm_mod]<br>
> > > [ 2225.140812]  blk_mq_dispatch_rq_list+0x90/<wbr>0x5b0<br>
> > > [ 2225.211769]  blk_mq_sched_dispatch_<wbr>requests+0x107/0x1a0<br>
> > > [ 2225.240825]  __blk_mq_run_hw_queue+0x5f/<wbr>0xf0<br>
> > > [ 2225.264852]  process_one_work+0x141/0x340<br>
> > > [ 2225.287872]  worker_thread+0x47/0x3e0<br>
> > > [ 2225.308354]  kthread+0xf5/0x130<br>
> > > [ 2225.396405]  ret_from_fork+0x32/0x40<br>
> > ><br>
> > > That call trace did not show up before this patch series was added to<br>
> > > Jens'<br>
> > > tree. This is a regression. Could this have been introduced by this<br>
> > > patch<br>
> > > series?<br>
> > ><br>
> > > Thanks,<br>
> > ><br>
> > > Bart.<br>
> ><br>
> > Hi Bart<br>
> > One thing to note.<br>
> ><br>
> > I tested Mike's combined tree on the weekend fully dm4.16-block4.16 and<br>
> > did not see this.<br>
> > This was with Mike combined tree and SRPT running 4.13-rc2.<br>
> ><br>
> > I also tested your tree Monday with the revert of the scatter/gather<br>
> > patches with both SRP and SRPT running your tree and it was fine.<br>
> ><br>
> > So its a combination of what you provided me before and that has been<br>
> > added to your tree.<br>
> ><br>
> > Mike combined tree seemed to be fine, I can revisit that if needed. I<br>
> > still have that kernel in place.<br>
> ><br>
> > I was not running latest SRPT when I tested Mike's tree<br>
><br>
> Hello Laurence,<br>
><br>
> The tree I sent you this morning did not only include Mike's latest dm code<br>
> but also Jens' latest for-next branch. So what you wrote above does not<br>
> contradict what I wrote in my e-mail, namely that I suspect that a regression<br>
> was introduced by the patches in the series "blk-mq: improve DM's blk-mq IO<br>
> merging via blk_insert_cloned_request feedback". These changes namely went in<br>
> through the block tree and not through the dm tree. Additionally, these<br>
> changes were not present in the block-scsi-for-next branch I sent you on<br>
> Monday.<br>
<br>
</div></div>Functionality shouldn't be any different than the variant (Ming's v4)<br>
that Laurence tested on Sunday/Monday (once we got past the genirq issue<br>
on HPSA).<br>
<br>
But sure, I suppose there is something I missed when refactoring Ming's<br>
change to get it acceptable for upstream.  I went over the mechanical<br>
nature of what I did many times (comaping Ming's v4 to my v5).<br>
<br>
Anyway, we'll see how Laurence fairs with this tree (but with the revert<br>
of 84676c1 added, so his HPSA server will boot):<br>
<a href="https://git.kernel.org/pub/scm/linux/kernel/git/snitzer/linux.git/log/?h=block-4.16_dm-4.16" rel="noreferrer" target="_blank">https://git.kernel.org/pub/<wbr>scm/linux/kernel/git/snitzer/<wbr>linux.git/log/?h=block-4.16_<wbr>dm-4.16</a><br>
(which is the same as linux-dm.git's 'for-next' at the moment)<br>
<br>
The call to blk_mq_request_bypass_insert will only occur via<br>
__blk_mq_fallback_to_insert.  Which as the name implies this is not the<br>
fast path.  This will occur if the underlying blk-mq device cannot get<br>
resources it needs in order to issue the request.  Specifically: if/when<br>
in __blk_mq_try_issue_directly() the hctx is stopped, or queue is<br>
quiesced, or it cannot get the driver tag or dispatch_budget (in the<br>
case of scsi-mq).<br>
<br>
The same fallback, via call to blk_mq_request_bypass_insert, occured<br>
with Ming's v4 though.<br>
<br>
Anyway, we'll see what Laurence finds when testing my above kernel.<br>
<span class="HOEnZb"><font color="#888888"><br>
Mike<br>
</font></span></blockquote></div><br></div>