<div dir="ltr"><div class="gmail_extra"><div class="gmail_quote">On Sun, Nov 1, 2015 at 10:40 AM, Georgios Kourachanis <span dir="ltr"><<a href="mailto:geo.kourachanis@gmail.com" target="_blank">geo.kourachanis@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
  

    
  
  <div bgcolor="#FFFFFF" text="#000000"><tt>Intel Core i7</tt><tt> 3770 ( I use the igpu for the
      archlinux)</tt><tt><br></tt><tt></tt></div></blockquote><div>[snip] </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div bgcolor="#FFFFFF" text="#000000"><tt>  <memoryBacking></tt><tt><br>
    </tt><tt>    <hugepages/></tt><tt><br>
    </tt><tt>  </memoryBacking></tt><tt><br>
    </tt><tt>  <vcpu placement='static'>4</vcpu></tt><tt><br>
    </tt><tt>  <cputune></tt><tt><br>
    </tt><tt>    <vcpupin vcpu='0' cpuset='2'/></tt><tt><br>
    </tt><tt>    <vcpupin vcpu='1' cpuset='3'/></tt><tt><br>
    </tt><tt>    <vcpupin vcpu='2' cpuset='6'/></tt><tt><br>
    </tt><tt>    <vcpupin vcpu='3' cpuset='7'/></tt><tt><br>
    </tt><tt>  </cputune></tt><tt><br></tt><tt></tt></div></blockquote><div>[snip] </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div bgcolor="#FFFFFF" text="#000000"><tt>  <cpu mode='host-passthrough'></tt><tt><br>
    </tt><tt>    <topology sockets='1' cores='4' threads='1'/></tt><tt><br>
    </tt><tt>  </cpu></tt></div></blockquote><div>[snip]</div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div bgcolor="#FFFFFF" text="#000000"><tt><br>
    </tt><tt>1) Using "</tt><tt><topology sockets='1' cores='4'
      threads='1'/></tt><tt>" instead o</tt><tt>f </tt><tt>"</tt><tt><topology
      sockets='1' cores='</tt><tt>2</tt><tt>' threads='</tt><tt>2</tt><tt>'/></tt><tt>"
      provided about 2% boost in GPU performance. No change in RAM or
      CPU tests. I've tested with the passmark</tt><tt>.</tt><tt><br>
    </tt><tt><br>
    </tt><tt>2) I tried using the emulatorpin method Alex says on a mail
      here on </tt><tt>vfio-users</tt><tt>, but I didn't notice any
      changed in GPU performance. I didn't test it on the CPU side
      though.</tt></div></blockquote><div><br></div><div>So now that you're using virtio networking and you're in the ballpark of performance, why are you comparing bare metal, where the game has 4 cores + threads to a config with only 2 cores + threads?  Have you tried giving it more cores?  Less threads?  Have you tried using the sibling threads only for emulatorpin?  Have you tried isolcpus and nohz_full to dedicate as much CPU resources as you can bear to the VM to test how close you can get to bare metal?  In my experience, threads are somewhat useful in the host, but you really need to be careful how you make use of them for a VM.  A quad-core may really only be marginal for running a high performance gaming VM.</div><div> </div></div></div></div>