注:本次环境在云服务ubuntu环境下进行,大家浏览时注意版本信息
注:能看此文章的应该都有些基础,个别命令我就不加以说明了
此命令用于 清理现有的 NVIDIA 驱动程序和相关库
sudo apt-get --purge remove "*nvidia*" "libxnvctrl*"
1、安装ubuntu-drivers-common
用于确定NVIDIA 显卡型号和查看推荐的驱动程序
# 更新 所有包
sudo apt update
# 升级所有包
sudo apt upgrade
# 安装 ubuntu-drivers-common
sudo apt install ubuntu-drivers-common
2、查看显卡及推荐驱动
注:
可以看到我的显卡信息为 Tesla P40
可以看到推荐使用的显卡驱动 nvidia-driver-550 - distro non-free recommended
ubuntu-drivers devices
3、安装显卡驱动
注:
个人建议 不要安装推荐版本而是安装推荐版本的之前版本
个人建议 安装非-server版本
个人建议 使用手动安装而不是自动安装(全是坑)
# 自动安装推荐显卡驱动
sudo ubuntu-drivers autoinstall
# 手动安装指定版本显卡驱动 (推荐)
sudo apt install nvidia-driver-550
4、重启测试
# 重启
sudo reboot
# 查看显卡信息
nvidia-smi
亲测可用
5、部分问题说明
重启!重启!重启! 安装显卡驱动时记得重启
Failed to initialize NVML: Driver/library version mismatch
NVML library version: 550.120
需要重启
sudo modprobe nvidia modprobe: FATAL: Module nvidia not found in directory /lib/modules/6.8.0-31-generic
查看自己安装驱动时使用的命令是否携带了server 或者 使用使用了自动安装,切换成手动指定版本即可
重启生效
"sudo dpkg --configure -a"
注意查看异常信息 部分报错会提示你使用此命令 ,执行此命令后 尝试重新手动安装
重启生效
Loading new nvidia-srv-535.216.01 DKMS files...
Building for 6.8.0-31-generic 6.8.0-48-generic
Building for architecture x86_64
Building initial module for 6.8.0-31-generic
EFI variables are not supported on this system
/sys/firmware/efi/efivars not found, aborting.
出现此消息时不要中断操作 等待全部执行完在进行操作,导致此问题出现原因可能时安装的显卡驱动和当前系统冲突 尝试安装推荐驱动版本之前的一个版本 注意安装时不要安装携带-server的驱动