Nvidia GPU 直通失败,代码为 43
Posted
技术标签:
【中文标题】Nvidia GPU 直通失败,代码为 43【英文标题】:Nvidia GPU passthrough fail with code 43 【发布时间】:2017-05-12 19:00:11 【问题描述】:我目前正在尝试使用 qemu 2.5 和 libvirt 1.3.5 将 nvidia GPU 传递给 Windows 10 来宾。
我在设备管理器中看到 Nvidia GPU 上的“错误 43”。
我曾尝试通过添加“kvm=off”和“hv_vendor_id=123456780ab”来隐藏虚拟机管理程序,但它对我不起作用。我在谷歌搜索,人们用这种方式解决了这个问题。
我还在任务管理器中看到了虚拟机:是的。
我是否以错误的方式使用?我可以将 AMD gpu 传递给 windows guest(AMD 不检查 kvm 虚拟化)。
我可以用其他方式欺骗 nvidia 吗?
我的系统信息:
#uname -a
Linux ns.mqcache.net 4.2.0-1.el7.elrepo.x86_64 #1 SMP Sun Aug 30 21:25:29 EDT 2015 x86_64 x86_64 x86_64 GNU/Linux
#/root/qemu25/qemu/x86_64-softmmu/qemu-system-x86_64 --version
QEMU emulator version 2.5.1.1, Copyright (c) 2003-2008 Fabrice Bellard
GPU:
02:00.0 VGA compatible controller: NVIDIA Corporation GF119 [GeForce GT 620 OEM] (rev a1)
02:00.1 Audio device: NVIDIA Corporation GF119 HDMI Audio Controller (rev a1)
libvirt.xml
<domain xmlns:qemu="http://libvirt.org/schemas/domain/qemu/1.0" type="kvm">
<name>win10</name>
<os>
<type machine="q35">hvm</type>
<boot dev="hd"/>
<boot dev="cdrom"/>
</os>
<features>
<acpi/>
<apic/>
<hyperv>
<vendor_id state='on' value='1234567890ab'/>
</hyperv>
<kvm>
<hidden state='on'/>
</kvm>
</features>
<clock offset="localtime">
<timer name="rtc" tickpolicy="catchup"/>
<timer name="pit" tickpolicy="delay"/>
<timer name="hpet" present="no"/>
<timer name='hypervclock' present='yes'/>
</clock>
<on_poweroff>destroy</on_poweroff>
<on_reboot>restart</on_reboot>
<on_crash>destroy</on_crash>
<vcpu current="4">4</vcpu>
<cpu mode="host-passthrough">
<topology sockets="1" cores="4" threads="1"/>
</cpu>
<memory>8388608</memory>
<currentMemory>8388608</currentMemory>
<devices>
<emulator>/root/qemu25/qemu/x86_64-softmmu/qemu-system-x86_64</emulator>
<disk device="disk" type="file">
<driver name="qemu" type="qcow2"/>
<source file="/root/vm/win10/image.qcow2"/>
<target bus="virtio" dev="vda"/>
</disk>
<sound model="ac97"/>
<interface type="bridge">
<mac address="fa:16:3e:81:00:03"/>
<source bridge="eucabr"/>
<model type="virtio"/>
<driver name="qemu"/>
<alias name="net0"/>
</interface>
<hostdev mode="subsystem" type="pci" managed="yes">
<source>
<address domain="0x0000" bus="0x02" slot="0x00" function="0x1"/>
</source>
</hostdev>
</devices>
<qemu:commandline>
<qemu:arg value="-machine"/>
<qemu:arg value="smm=off"/>
<qemu:arg value="-device"/>
<qemu:arg value="ioh3420,bus=pcie.0,addr=1c.0,multifunction=on,port=1,chassis=1,id=root.1"/>
<qemu:arg value="-device"/>
<qemu:arg value="vfio-pci,host=02:00.0,bus=root.1,addr=00.0,multifunction=on,x-vga=on"/>
<qemu:arg value="-vga"/>
<qemu:arg value="none"/>
</qemu:commandline>
</domain>
qemu 命令
/root/qemu25/qemu/x86_64-softmmu/qemu-system-x86_64 \
-name win10 \
-machine q35,accel=kvm,usb=off \
-cpu host,kvm=off,hv_relaxed,hv_spinlocks=0x1fff,hv_vapic,hv_time,hv_vendor_id=blah \
-m 2048 \
-realtime mlock=off \
-smp 2,sockets=1,cores=2,threads=1 \
-no-user-config \
-nodefaults \
-rtc base=localtime \
-no-shutdown \
-boot strict=on \
-device i82801b11-bridge,id=pci.1,bus=pcie.0,addr=0x1e \
-device pci-bridge,chassis_nr=2,id=pci.2,bus=pci.1,addr=0x1 \
-drive file=/root/vm/win10/snap.qcow2,if=none,id=drive-virtio-disk0,format=qcow2 \
-device virtio-blk-pci,scsi=off,bus=pci.2,addr=0x2,drive=drive-virtio-disk0,id=virtio-disk0,bootindex=1 \
-k en-us \
-device virtio-balloon-pci,id=balloon0,bus=pci.2,addr=0x4 \
-machine smm=off \
-device ioh3420,bus=pcie.0,addr=1c.0,multifunction=on,port=1,chassis=1,id=root.1 \
-device vfio-pci,host=02:00.0,bus=root.1,addr=00.0,multifunction=on,x-vga=on \
-device vfio-pci,host=02:00.1,bus=root.1,addr=00.1 \
-msg timestamp=on \
-vga none
期待您的帮助!
【问题讨论】:
【参考方案1】:您需要将未修改的显卡 ROM 副本传递给 VM。
您需要一个可用作主要 GPU 的辅助 GPU 过程。 如果没有 直通 GPU 作为辅助卡 将额外的卡放入主插槽,将预期的直通卡放入另一个 pci-e 端口并启动。 通过 lspci -v 再次找到您想要的 GPU。就我而言,它的地址大致相同。现在您可以将 ROM 转储到文件中:
# echo "0000:05:00.0" > /sys/bus/pci/drivers/vfio-pci/unbind
# cd /sys/bus/pci/devices/0000\:05\:00.0
# echo 1 > rom
# cat rom > /home/username/KVM/evga_gtx970.dump
# echo 0 > rom
# echo "0000:05:00.0" > /sys/bus/pci/drivers/vfio-pci/bind
在这种情况下,0000:05:00.0 是我的 PCI 卡地址。您实际上并不需要底部的绑定步骤,因为无论如何您都会重新启动。
您可以在https://github.com/awilliam/rom-parser 使用这个方便的实用程序检查 ROM 转储的完整性。我的 rom 看起来像:
# ./rom-parser evga_gtx970.dump
Valid ROM signature found @0h, PCIR offset 1a0h
PCIR: type 0 (x86 PC-AT), vendor: 10de, device: 13c2, class: 030000
PCIR: revision 0, vendor revision: 1
Valid ROM signature found @f400h, PCIR offset 1ch
PCIR: type 3 (EFI), vendor: 10de, device: 13c2, class: 030000
PCIR: revision 3, vendor revision: 0
EFI: Signature Valid, Subsystem: Boot, Machine: X64
Last image
您应该在转储中同时拥有 EFI 和非 EFI x86 ROM(我认为大多数卡都有)
关闭机器并将 GTX 1070 放回主插槽。启动后,编辑您的 VM xml,在您的 GPU 部分(如果您已经将 GPU 分配给 VM)应该有一个部分。向其中添加一个 file='path/to/dump/here' 语句。我的完整部分如下所示:
<hostdev mode='subsystem' type='pci' managed='yes'>
<source>
<address domain='0x0000' bus='0x01' slot='0x00' function='0x0'/>
</source>
<rom bar='on' file='/home/username/KVM/evga_gtx970.dump'/>
<address type='pci' domain='0x0000' bus='0x00' slot='0x03' function='0x0'/>
</hostdev>
这将使虚拟机使用该 Bios 启动卡,而不是内核提供的任何内容。
source
请注意,您必须使用 OVMF (EFI),因为 SeaBIOS 无法正确使用卡 ROM。
【讨论】:
对我来说,以这种方式转储 BIOS 是可行的,但通过 GPU-Z 转储产生的 BIOS 无法正常工作。然而 rom-parser 说两者都是有效的。工作 BIOS 是 126K,非工作 BIOS 是 253K。 我经过的卡是我的副卡。我已经让我的主机用 vfio 忽略它。当我启动主机时没有什么可以转储的,除非我已经启动到主机,然后我可以从那个 GPU 转储 rom。这和你描述的不一样吗? 不确定我是否理解您的情况。请您解释的更详细一点好吗?【参考方案2】:如果您使用的是 OVMF 或其他 UEFI,请确保再次检查您的卡是否支持 UEFI,尤其是对于 2014 年以前的东西。
我错误地认为我的是(GTX 770),而事实上,它不是(在线查看了错误版本的 ROM)并且浪费了将近 2 天的时间来扯掉我的头发。查找 UEFI 支持 like so 并查找 ROM 更新 here。
我刷了我的卡,但我认为您可以将启用 UEFI 的 ROM 设置为romfile=
。看来other manufacturers' ROMs could work too,如果您没有适合您的 UEFI 修复程序。
【讨论】:
确实这种“错误印象”是我的问题。我去了那个网站,为我的卡型号下载了最新的固件,然后,BAM!,它工作了。以上是关于Nvidia GPU 直通失败,代码为 43的主要内容,如果未能解决你的问题,请参考以下文章
在没有物理 NVidia GPU 卡的虚拟机上运行 CUDA
NVIDIA显卡设置不可用——您当前未使用连接到NVIDIA GPU的显示器
NVIDIA显卡设置不可用——您当前未使用连接到NVIDIA GPU的显示器
尝试同时使用板载 iGPU 和 Nvidia 独立卡时,CUDA 失败。我如何同时使用离散的 nvidia 和集成(板载)intel gpu? [关闭]