美文网首页嵌牛IT观察
分布式机器学习(二)框架安装之NVIDIA驱动

分布式机器学习(二)框架安装之NVIDIA驱动

作者: Lontano_wjk | 来源:发表于2022-03-21 15:03 被阅读0次

姓名:王佳昆

学号:21011210148

学院:通信工程学院

【嵌牛导读】安装NVIDIA驱动

【嵌牛鼻子】NVIDIA驱动

【嵌牛提问】如何安装正确NVIDIA驱动?

【嵌牛正文】

1.安装NVIDIA驱动

        重复登录的问题是因为NVIDIA驱动版本和linux内核版本不匹配导致的,因为linux内核一直在更新,更新后可能不匹配。

        所以安装系统后选择不更新,也有命令,可以更新内核版本使得nvidia匹配。

(1)查询NVIDIA驱动

        首先去官网(http://www.nvidia.com/Download/index.aspx?lang=en-us)查看适合自己显卡的驱动(下载runfile文件):

2)安装驱动

1、先按Ctrl + Alt + F1到控制台,关闭当前图形环境 


$sudo service lightdm stop


2、卸载可能存在的旧版本 nvidia 驱动


$sudo apt-get remove --purge nvidia*


3、安装驱动可能需要的依赖


$sudo apt-get update

$sudo apt-get install dkms build-essential linux-headers-generic


把 nouveau 驱动加入黑名单并禁用用 nouveau 内核模块(如果新重装的系统,没有驱动起作用,忽略)


$sudo nano /etc/modprobe.d/blacklist-nouveau.conf


在文件 blacklist-nouveau.conf 中加入如下内容:


blacklist nouveau

options nouveau modeset=0


保存退出,执行


$sudo update-initramfs -u

$sudo reboot #重启


4、检查


$uname -a 查看目前在用的内核版本

$dpkg --get-selections|grep linux-image 显示所有的内核版本

$sudo apt remove linux-image-XXXX-generic 卸载旧内核,注意只保留最新的 两个 版本

$sudo apt autoremove 清理无用的依赖


5、运行驱动安装文件

重启后再次进入字符终端界面(Ctrl + Alt + F1),并关闭图形界面


$sudo service lightdm stop


安装驱动


$sudo chmod u+x NVIDIA-Linux-x86_64-361.45.11.run

$sudo ./NVIDIA-Linux-x86_64-361.45.11.run(sudo ./NVIDIA-Linux-x86_64-375.20.run –no-opengl-files)

或 sudo ./NVIDIA-Linux-x86_64-375.20.run –no-x-check –no-nouveau-check –no-opengl-files


注:kenel 不装选NO; X-config Yes

最后重新启动图形环境


$sudo service lightdm start


可以通过以下命令确认驱动是否正确安装


$cat /proc/driver/nvidia/version


相关文章

网友评论

    本文标题:分布式机器学习(二)框架安装之NVIDIA驱动

    本文链接:https://www.haomeiwen.com/subject/bsctjrtx.html