参考文章来源:https://jizhong.plus/post/2024/05/x99-pve-gpu-passthrough.html
1、BIOS虚拟化配置
从 PVE 官网下载好最新的 PVE 8.2 的镜像,然后用 rufus 刻录到 U 盘。然后开机,按 Delete 进入 bios,设置从 U 盘启动,就可以进行系统安装了。
但是在安装 PVE 系统之前,我们先做好几个操作,以保证可能顺利完全虚拟化工作。
启用 VT-D : IntelRCSetup - IIO Configuration - Intel VT for Directed i/o (VT-d)
启用 VMX:IntelRCSetup - Processor Configuration - VMX
启用 4G:Advanced - PCI Subsystem settings - Above 4G Decoding
启用来电启动:IntelRCSetup - PCH Configuration - Restore AC after Power Loss - Power On
禁用 CSM:Advanced - CSM Configuration 将 Other PCI devices、Video、Storage、Network 改成 UEFI,保存设置重启再进来,就可以将 CSM Support 禁用了。此时亮机卡,就需要支持 uefi 了,否则接显示器就没有任何显示,bios 都无法进去,直接黑屏。对于是否一定要禁用 CSM 这一点,笔者认为还有点商榷,有条件的可以在不禁用的情况下多做几次实验。
踩坑提示:禁用 CSM - CSM Configuration - Video是否修改成UEFI需要检查显卡是否支持,否则只能BIOS主板放电重置。
踩坑提示:华南主板放电恢复BIOS出厂设置,拔掉电池等一晚上居然BIOS未被重置,放电技巧:
① 拔掉电源&拔掉主板BIOS电池;② 拔掉主板电源排线(24pin主板电源线);③如果安装有算力GPU卡,拔掉显卡电源线;④ 电池反装之后多按几次开机键恢复出厂设置;
电源以及显卡不断电情况下,电容电量超过1天都不能恢复BIOS出厂。
启用 X2APIC:IntelRCSetup - Processor Configuration - X2APIC
X2APIC 在显卡直通的时候需要
另外就是跑大模型还可能需要 CPU 支持 AVX 指令集,精粤 X99 主板 BIOS 找不到这个设置项,实际上是默认就开启的。但是 AVX 默认无法透传到 PVE 的虚拟机中去,需要在 PVE 里面再进行二次设置。
在上面选项都设置完毕后,直接重启从 U 盘启动,就可以安装 PVE 虚拟化了。安装完成后,通过 IP 地址从浏览器访问 8006 端口,就可以进行一系列操作了。
2、PVE 8.2 安装
U盘启动盘制作省略,参略网上教程,
2.1 安装Proxmox VE (Terminal UI) 遭遇卡住不动无法执行安装PVE 8.2的问题。
在 Proxmox VE (Terminal UI) 那一行上面按 e 进入编辑,然后找到 Linux 开头的那一行,将光标移动到最后,添加参数 nomodeset 保存之后,再执行安装。
注意:命令行末尾添加 nomodeset 参数单次有效,如果重新安装重复此步骤
2.2 安装过程中输入密码以及邮箱键盘字符对不上的问题
安装过程遇到的一个坑,记得先插入网线,通网之后再安装PVE系统,默认应该键盘是美标键盘,键位字符会出现错位的问题。
3、显卡直通
配置显卡直通需要进入 PVE Linux 系统,按照以下步骤执行相关命令。
3.1 开启 IOMMU 功能
配置 GRUB
shell
更新 GRUB
加载对应的内核模块
shell
更新完 GRUB 和内核模块,需要重启 PVE 系统,再进行后续操作。
验证 IOMMU 是否启用
shell
验证 VFIO 模块
shell
验证是否支持中断映射
shell
允许不安全的中断
shell
为 NVIDIA 显卡添加稳定性优化
shell
主要防止虚拟机异常影响到宿主机。
屏蔽默认驱动,直通显卡
shell
适用于 NVIDIA 显卡,如果是 AMD 显卡是有差异的。
更新内核引导文件
shell
更新完成后,重启系统就可以了。
重启完成后,进入 pve web 控制台,就可以为某个虚拟机单独配置显卡了。
添加显卡成功后,需要先关机,再开机,直接重启是无效的。重新开机后,进入系统就可以安装对应的显卡驱动和 CUDA 了。
shell
4、踩坑点
4.1、AVX 指令集
在笔者安装好虚拟机之后,执行 lscpu
发现没有 AVX。但笔者的 CPU 是确定支持的,问了主板方,也说默认启用了。后来发现这东西还要去 PVE 里设置。因为在 PVE 系统这执行 lscpu
是确定有 AVX 的。解决这个问题只要登录 PVE 控制台,将 CPU 类别改成 host 即可。
4.2、显卡直通后卡在 Loading 界面
显卡设置直通后,启动 PVE 系统会卡在 Loading initial ramdisk … 界面,不出现系统登录界面。这个是正常情况,实际上 PVE 系统已经启动了,通过 ssh 工具或者浏览器访问就可以了。 ]
5、急救恢复
如果在更新完 GRUB 或内核引导文件重启后无法进入系统,可以使用 U 盘,进入 recovery mode 进行修复。