首页 资讯 > 正文

在Proxmox VE 7.4 中开启矿卡NVIDIA P106显卡虚拟化

2023-04-16 03:52:46 哔哩哔哩

前言

本文使用硬件为Pascal架构的P106显卡,如您使用的显卡非本架构请自行变通

本文也在NVIDIA CMP 40HX进行验证也可用

例如ampere架构的显卡需要自行开启VF,且每个VF仅能选择一个配置开启


(资料图片仅供参考)

文中提及的libvgpu_unlock_rs.so、NVIDIA-Linux-x86_64-525.85.07-vgpu-kvm-patched.run 、528.24_grid_win10_win11_server2019_server2022_dch_64bit_international.exe 均在上传中

传完了评论区见

本文内核为pve-kernel-5.15.102-1-pve,如果是6.2.9内核请使用NVIDIA-Linux-x86_64-525.85.07-vgpu-kvm-kernel-6.2.9-patched.run

以下本文使用的主要硬件及配置,如果您平台与本篇差距过大也请自行变通

主板:ASUS B150 PRO GAMING D3 (其他主板怎么动bios你自己看着办)

CPU:Intel QQLT (不是Intel的U开启IOMMU方法不一样)

内存:3条8G的DDR3绿条

存储:傲腾16G

所谓显卡:NVIDIA P106-090(用NVIDIA CMP 40HX也不影响,其他卡我也没有不知道)

网络存储:嗨群晖开启SMB及NFS

后续补充及勘误见评论区,如有重大修正会直接编辑文章

BIOS设置

开启VT

如图所示,开启VT功能

开启VT-d

如图所示,开启VT-d

开启主要输出为核显

不开启核显可能导致P106插上去后,就黑屏了

后续有兴趣你也可以顺便玩玩Intel的GVT-G

安全引导设置

关闭安全引导,或者是选择非Windows系统

安装PVE

略,这个有啥好说的,非本文重点好吧

查看系统信息

查看内核cmdline

cat /proc/cmdline

此步骤可以迅速排查引导参数导致翻车的问题

如图所示,参数未有所需的

查看IOMMU状态

这一步不用命令行,直接在这个添加PCI设备看一眼就行

如图所示这种状态就是没开起来

查看显卡情况

使用lspci -v -d 10DE:即可,此步骤防止你以为卡插好了实际上并没有的情况

如图所示,这是一张P106-090

修改相关配置及参数

/etc/modules

echo -e "vfio\nvfio_iommu_type1\nvfio_pci\nvfio_virqfd" >> /etc/modules

/etc/modprobe.d/pve-blacklist.conf

echo "blacklist nouveau" >> /etc/modprobe.d/pve-blacklist.conf

内核cmdline

此处需要注意不同启动方式需要修改的文件不同

本例为/etc/default/grub

添加intel_iommu=on iommu=pt spectre_v2=off到如图所示位置,spectre_v2参数非必须相关参数

安装依赖及软件包

更换软件源

如下4行,执行便可

订阅源要如图所示选中并点击禁用

安装包

一句apt update即可

apt install -y build-essential dkms pve-headers-$(uname -r) mdevctl

刷新grub及引导

分别运行update-grub及update-initramfs -u -k all即可,随后使用reboot重启

重启后检查

如下所示,cmdline应有刚才添加的内容,添加PCI设备也消去了警告

host安装VGPU驱动

创建相关配置

上传必须文件

上传前需要通过mkdir -p /opt/vgpu_unlock-rs/target/release创建文件夹

随后通过ssh或者是其他方式上传libvgpu_unlock_rs.so及 NVIDIA-Linux-x86_64-525.85.07-vgpu-kvm-patched.run

上传完了记得用chmod给run文件加可执行权限

安装host驱动

一句./NVIDIA-Linux-x86_64-525.85.07-vgpu-kvm-patched.run 就跑起来了

检查安装情况

保险起见可以先使用systemctl restart {nvidia-vgpud.service,nvidia-vgpu-mgr.service}启动相关服务

随后使用nvidia-smi以及mdevctl types查看

guest安装VGPU驱动

向虚拟机添加设备

首先给你要跑gpu的虚拟机添加设备

记得虚拟机改成q35,CPU不会选的话直接host,nvidia启动对CPU是有要求的

虚拟机安装guest驱动

想个办法,无论是走smb也好,nfs也好,还是浏览器也好,把对应版本的GRID驱动丢进去安装

注意,如果版本高于宿主机驱动,或者是低于宿主机驱动版本,均有可能出现包括但不限于装不上、感叹号等异常

如下,Windows虚拟机安装驱动528.24_grid_win10_win11_server2019_server2022_dch_64bit_international.exe完成

可以去PVE看看

启用授权

此过程略过,如需了解请看另外一篇文章,那篇有介绍

授权文件丢进文件夹后,重启如图所示的服务

后记

本文成篇于深夜,行文仍需调整,欢迎各位指正优化

好困,顶不住了,后面再改改优化优化

其实40HX等矿卡也差不多这个玩法

我看NVIDIA被开源源码的话50HX那些是有搞头的,什么时候价格好起来了捡一张回来试试

关键词:

责任编辑:meirong

返回首页
相关新闻
返回顶部