<p dir="ltr">Well, old systemd and dbus didn't help. System was locked up again this morning.  Left the screen on tailing dmesg, but there was nothing interesting output.  I've got a PKGBUILD for 4.1.11 coming later today, so maybe that will help.</p>
<p dir="ltr">Dan</p>
<div class="gmail_quote">On Oct 22, 2015 10:53 PM, "Dan Ziemba" <<a href="mailto:zman0900@gmail.com">zman0900@gmail.com</a>> wrote:<br type="attribution"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hey,<br>
<br>
I maintain that PKGBUILD.  I think I've been having the same problem,<br>
but it seems to also happen if I reinstall the older linux-vfio 4.1.6.<br>
Here's the latest stack trace I was able to capture: <a href="https://i.imgur.co" rel="noreferrer" target="_blank">https://i.imgur.co</a><br>
m/FZkj4ib.jpg  I had to disable the screen timeout so it would stay on<br>
all night with dmesg tailing and I found it like this in the morning.<br>
 Mouse and caps lock still worked, but I couldn't actually do anything<br>
and the clock was frozen.<br>
<br>
I was also noticing that booting my system was unreliable.  If I would<br>
reboot several times in a row, once every two to three time, it would<br>
hang while starting various services and then never start gdm.<br>
<br>
Today I tried downgrading systemd and dbus to just before the change<br>
that switched to user buses (See here: <a href="https://www.archlinux.org/news/d
-bus-now-launches-user-buses/" rel="noreferrer" target="_blank">https://www.archlinux.org/news/d<br>
-bus-now-launches-user-buses/</a> ;) I reboot a whole bunch of times using<br>
4.1.10 linux-vfio-lts and it seems reliable.  I have been using the<br>
computer pretty much all day for work and it hasn't had any of the soft<br>
lockup yet, but it may be too soon to tell.  Most of the time in the<br>
past the lockup would happen while idle.<br>
<br>
These are the downgrades I made, everything else is up to date as of<br>
this morning.<br>
<br>
[2015-10-22 12:22] [ALPM] transaction started<br>
[2015-10-22 12:22] [ALPM] downgraded libsystemd (227-1 -> 225-1)<br>
[2015-10-22 12:22] [ALPM] downgraded libdbus (1.10.0-4 -> 1.10.0-2)<br>
[2015-10-22 12:22] [ALPM] downgraded dbus (1.10.0-4 -> 1.10.0-2)<br>
[2015-10-22 12:22] [ALPM] downgraded systemd (227-1 -> 225-1)<br>
[2015-10-22 12:22] [ALPM] downgraded lib32-systemd (227-1 -> 225-1)<br>
[2015-10-22 12:22] [ALPM] downgraded systemd-sysvcompat (227-1 -> 225-1)<br>
[2015-10-22 12:22] [ALPM] transaction completed<br>
<br>
I will follow up tomorrow with whether or not it locks up tonight.  If<br>
we can isolate the problem to systemd or dbus, maybe that's at least<br>
good enough for a bug report.<br>
<br>
Dan<br>
<br>
-----Original Message-----<br>
From: Lucas Kückelhaus <<a href="mailto:lucas@kuckelhaus.com">lucas@kuckelhaus.com</a>><br>
To: <a href="mailto:vfio-users@redhat.com">vfio-users@redhat.com</a><br>
Subject: [vfio-users] Soft lockup on archlinux 4.1.10-1-vfio-lts kernel<br>
Date: Thu, 22 Oct 2015 23:00:37 -0200<br>
Mailer: Roundcube Webmail/1.0.2<br>
<br>
Hi,<br>
<br>
I'm trying to run an Archlinux host on kernel 4.1.10-1-vfio-lts (Mark<br>
Weiman's custom repo) because I'm unable to boot a GPU-assigned VM on<br>
4.2.3-1-vfio.<br>
<br>
The VM boots fine and works for a while, but the computer sporadically<br>
crashes with the following:<br>
<br>
<br>
Oct 22 21:43:37 kvmhost kernel: NMI watchdog: BUG: soft lockup - CPU#4<br>
stuck for 22s! [swapper/4:0]<br>
Oct 22 21:43:39 kvmhost kernel: Modules linked in: veth vhost_net vhost<br>
macvtap macvlan tun bridge stp llc nls_iso8859_1 nls_cp437 vfat fat<br>
iTCO_wdt iTCO_vendor_support nouveau snd_hda_codec_hdmi intel_rapl<br>
iosf_mbi x86_pkg_temp_thermal intel_powerclamp coretemp mxm_wmi snd_hda_<br>
Oct 22 21:43:39 kvmhost kernel:  sch_fq_codel fuse nfsd nfs auth_rpcgss<br>
oid_registry nfs_acl lockd grace sunrpc fscache ip_tables x_tables ext4<br>
crc16 mbcache jbd2 dm_mod hid_logitech_hidpp hid_logitech_dj hid_generic<br>
usbhid hid sd_mod uas usb_storage atkbd libps2 crc32c_intel ah<br>
Oct 22 21:43:39 kvmhost kernel: CPU: 4 PID: 0 Comm: swapper/4 Tainted: G<br>
             L  4.1.10-1-vfio-lts #1<br>
Oct 22 21:43:39 kvmhost kernel: Hardware name: To Be Filled By O.E.M. To<br>
Be Filled By O.E.M./Z77 Extreme4, BIOS P2.30 09/21/2012<br>
Oct 22 21:43:39 kvmhost kernel: task: ffff88080b119460 ti:<br>
ffff88080b124000 task.ti: ffff88080b124000<br>
Oct 22 21:43:39 kvmhost kernel: RIP: 0010:[<ffffffff810f6770>]  <br>
[<ffffffff810f6770>] try_to_del_timer_sync+0x0/0xa0<br>
Oct 22 21:43:39 kvmhost kernel: RSP: 0018:ffff88082f303db0  EFLAGS:<br>
00000286<br>
Oct 22 21:43:39 kvmhost kernel: RAX: 00000000ffffffff RBX:<br>
0000000000000286 RCX: 0000000000000000<br>
Oct 22 21:43:39 kvmhost kernel: RDX: 00000000000000bf RSI:<br>
0000000000000286 RDI: ffff880270fa8428<br>
Oct 22 21:43:39 kvmhost kernel: RBP: ffff88082f303dc8 R08:<br>
0000000000002710 R09: ffff88082f30e780<br>
Oct 22 21:43:39 kvmhost kernel: R10: 0000000000000000 R11:<br>
0000000000000004 R12: ffff88082f303d28<br>
Oct 22 21:43:39 kvmhost kernel: R13: ffffffff815f13de R14:<br>
ffff88082f303dc8 R15: ffff880270fa8428<br>
Oct 22 21:43:39 kvmhost kernel: FS:  0000000000000000(0000)<br>
GS:ffff88082f300000(0000) knlGS:0000000000000000<br>
Oct 22 21:43:39 kvmhost kernel: CS:  0010 DS: 0000 ES: 0000 CR0:<br>
0000000080050033<br>
Oct 22 21:43:39 kvmhost kernel: CR2: 00007fc2d6f6da28 CR3:<br>
000000029c65c000 CR4: 00000000001426e0<br>
Oct 22 21:43:39 kvmhost kernel: Stack:<br>
Oct 22 21:43:39 kvmhost kernel:  ffffffff810f6872 ffff88082f303e38<br>
ffff880270fa8390 ffff88082f303df8<br>
Oct 22 21:43:39 kvmhost kernel:  ffffffff8152a16f ffff880270fa8390<br>
ffff8805b3bab800 ffff880270d20000<br>
Oct 22 21:43:39 kvmhost kernel:  0000000000000001 ffff88082f303e38<br>
ffffffff8152a3e7 ffff88082f3107e0<br>
Oct 22 21:43:39 kvmhost kernel: Call Trace:<br>
Oct 22 21:43:39 kvmhost kernel:  <IRQ><br>
Oct 22 21:43:39 kvmhost kernel:  [<ffffffff810f6872>] ?<br>
del_timer_sync+0x62/0x70<br>
Oct 22 21:43:39 kvmhost kernel:  [<ffffffff8152a16f>]<br>
inet_csk_reqsk_queue_drop+0xbf/0x240<br>
Oct 22 21:43:39 kvmhost kernel:  [<ffffffff8152a3e7>]<br>
reqsk_timer_handler+0xf7/0x2e0<br>
Oct 22 21:43:39 kvmhost kernel:  [<ffffffff8152a2f0>] ?<br>
inet_csk_reqsk_queue_drop+0x240/0x240<br>
Oct 22 21:43:39 kvmhost kernel:  [<ffffffff810f64c8>]<br>
call_timer_fn+0x48/0x160<br>
Oct 22 21:43:39 kvmhost kernel:  [<ffffffff8152a2f0>] ?<br>
inet_csk_reqsk_queue_drop+0x240/0x240<br>
Oct 22 21:43:39 kvmhost kernel:  [<ffffffff810f6bd4>]<br>
run_timer_softirq+0x284/0x330<br>
Oct 22 21:43:39 kvmhost kernel:  [<ffffffff81086711>]<br>
__do_softirq+0xf1/0x2e0<br>
Oct 22 21:43:39 kvmhost kernel:  [<ffffffff81086acd>] irq_exit+0xbd/0xc0<br>
Oct 22 21:43:39 kvmhost kernel:  [<ffffffff815f31d5>]<br>
smp_apic_timer_interrupt+0x55/0x70<br>
Oct 22 21:43:39 kvmhost kernel:  [<ffffffff815f13de>]<br>
apic_timer_interrupt+0x6e/0x80<br>
Oct 22 21:43:39 kvmhost kernel:  <EOI><br>
Oct 22 21:43:39 kvmhost kernel:  [<ffffffff81021c1d>] ?<br>
native_sched_clock+0x2d/0xa0<br>
Oct 22 21:43:39 kvmhost kernel:  [<ffffffff81490c81>] ?<br>
cpuidle_enter_state+0xa1/0x250<br>
Oct 22 21:43:39 kvmhost kernel:  [<ffffffff81490c53>] ?<br>
cpuidle_enter_state+0x73/0x250<br>
Oct 22 21:43:39 kvmhost kernel:  [<ffffffff81490e8a>]<br>
cpuidle_enter+0x2a/0x30<br>
Oct 22 21:43:39 kvmhost kernel:  [<ffffffff810cb36c>]<br>
cpu_startup_entry+0x32c/0x460<br>
Oct 22 21:43:39 kvmhost kernel:  [<ffffffff81055f7e>]<br>
start_secondary+0x19e/0x1e0<br>
Oct 22 21:43:39 kvmhost kernel: Code: 4d d8 65 48 33 0c 25 28 00 00 00<br>
44 89 e0 75 0b 48 83 c4 18 5b 41 5c 41 5d 5d c3 e8 1b b8 f8 ff 90 66 2e<br>
0f 1f 84 00 00 00 00 00 <0f> 1f 44 00 00 55 48 89 e5 41 54 53 48 81 ec<br>
30 10 00 00 48 83<br>
<br>
<br>
<br>
This happens for all cores and it locks up the entire system. I don't<br>
know what to do. On 4.2.3-1-vfio I have no hangups and all my non-vfio<br>
VMs work perfectly fine.<br>
<br>
Thank you,<br>
Lucas Kückelhaus<br>
<br>
_______________________________________________<br>
vfio-users mailing list<br>
<a href="mailto:vfio-users@redhat.com">vfio-users@redhat.com</a><br>
<a href="https://www.redhat.com/mailman/listinfo/vfio-users" rel="noreferrer" target="_blank">https://www.redhat.com/mailman/listinfo/vfio-users</a><br>
</blockquote></div>