美文网首页
2019-02-15

2019-02-15

作者: 柒布 | 来源:发表于2019-02-15 22:27 被阅读0次

在深度学习主机上搭建TensorFlow环境。系统是Ubuntu18.04,Python环境是Python3.6,显卡是GTX1080ti,配置cuda9.0+ cudnn7.3.1+tensorflow1.11GPU。第一次写博客,望大家多多支持!!!

0、预备工作

1. 验证电脑是否支持CUDA的GPU

2. 验证自己的Linux版本是否支持 CUDA

3. 验证是否安装gcc

4. 验证是否安装kernel header 和package development

1、安装显卡驱动

1.1、卸载旧版显卡驱动

首先卸载NVIDIA驱动,如果是通过附加驱动安装显卡的,则输入如下

sudo apt-get remove --purge nvidia-*

如果是安装的是官万下载的驱动,则重新运行run文件来卸载

sudoshNVIDIA-Linux-x86_64-410.73.run--uninstall

此时,显卡驱动现实如下:

1.2、下载显卡驱动

去Nvidia官网,下载相应的驱动程序

点击搜索,下载驱动

1.3、禁用自带显卡驱动

打开黑名单列表

sudo gedit /etc/modprobe.d/blacklist.conf

在列表最后加入

blacklist vga16fb

blacklist nouveau

blacklist rivafb

blacklist rivatv

blacklist nvidiafb

options nouveau modeset=0

保存后输入 

sudo update-initramfs -u

更新更改

1.4、安装新的显卡驱动

重启电脑,输入ctrl+alt+f6进入终端,停止X-windows服务,输入

sudo service lightdm stop

进入nvidia安装包目录,输入

sudo chmod a+x NVIDIA-Linux-x86_64-410.73.run

sudo sh NVIDIA-Linux-x86_64-410.73.run

按照提示安装,一路默认直到询问是否使用nv的xconfig文件,选择"yes",安装成功后,执行

sudo service lightdm restart

重启电脑,查看显卡驱动

2、安装Cuda9.0

2.1、下载cuda

目前只支持Cuda9.0,前往cuda官网,找到对应版本下载

2.2、降低gcc、g++版本

若现在直接安装cuda,则会提示

其原因是Ubuntu18.04的编译器版本过高,因此只需要安装较低版本的gcc、g++即可

sudo apt install gcc-4.8 g++-4.8

sudo ln -s /usr/bin/gcc-4.8 /usr/local/bin/gcc

sudo ln -s /usr/bin/g++-4.8 /usr/local/bin/g++

2.3、安装Cuda

接下来进入到下载目录,执行下面的安装命令:

sudo sh cuda_9.0.176_384.81_linux.run

看到一大段协议后一直回车,接下来会有一大堆问题

Do you accept the previously read EULA?(accept/deny/quit) 选择accept

Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 384.81?

因为已经安装过显卡驱动了,所以选择no

Install the CUDA 9.0 Toolkit? 选择yes

Enter Toolkit Location 直接回车默认 [ default is /usr/local/cuda-9.0 ]: 直接回车默认即可

Do you want to install a symbolic link at /usr/local/cuda?  选择yes

Install the CUDA 9.0 Samples? 问你是否安装样例,安装了吧,也占不了多少空间

Installing the CUDA Toolkit in /usr/local/cuda-9.0 ... 等待安装完成即可

安装完成后,显示以下内容

提示若想要删除cuda工具,直接运行pl脚本即可,进入目录

sudo perl uninstall_cuda_9.2.pl

最后一步,将cuda添加到环境变量,在终端输入

sudo gedit ~/.bashrc

然后加入

export PATH=/usr/local/cuda/bin:$PATH

export LD_LIBRARY_PATH=/usr/local/cuda/lib64:$LD_LIBRARY_PATH

完成后,重启终端输入nvcc -V,显示如下则表示cuda工具安装成功

3、安装cuDNN

进入cuDNN官网,下载对应版本

解压压缩包,将文件复制到cuda-9.2的安装目录,并修改权限:

sudo cp cuda/include/cudnn.h /usr/local/cuda/include

sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64

sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

4、安装Anaconda3

anaconda指的是一个开源的Python发行版本,其包含了conda、Python等180多个科学包及其依赖项。可以帮助python开发者省去很多安装科学包的工作。去官网下载对应版本

进入下载目录,输入以下指令下载

sudo bash Anaconda3-5.3.0-Linux-x86_64.sh

一直按回车或yes完成安装,完成安装

接下来配置环境变量,在终端输入

sudo gedit ~/.bashrc

然后加入

export PATH=~/anaconda3/bin:$PATH

更新配置,source  ~/.bashrc,输入python,查看是否安装成功

5、安装TensorFlow

Anaconda能够创建不同环境以满足不同需求,我们创建一个tensorflow的环境

conda create -n tensorflow pip python=3.6

接着激活conda环境

source activate tensorflow

最后为该环境安装tensorflow-gpu

pip3 install -i https://pypi.tuna.tsinghua.edu.cn/simple tensorflow-gpu

6、测试

新建python文件,运行测试程序

import tensorflow as tf

with tf.Session(config=tf.ConfigProto(allow_soft_placement=True, log_device_placement=False)) as sess:

    a = tf.constant(1)

    b = tf.constant(3)

    c = a + b

    print('结果是:%d\n 值为:%d' % (sess.run(c), sess.run(c)))

若输出为

2018-12-12 15:43:39.871883: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1432] Found device 0 with properties:

name: GeForce GTX 1080 Ti major: 6 minor: 1 memoryClockRate(GHz): 1.6575

pciBusID: 0000:02:00.0

totalMemory: 10.91GiB freeMemory: 10.00GiB

2018-12-12 15:43:39.871896: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1511] Adding visible gpu devices: 0

2018-12-12 15:43:40.042840: I tensorflow/core/common_runtime/gpu/gpu_device.cc:982] Device interconnect StreamExecutor with strength 1 edge matrix:

2018-12-12 15:43:40.042868: I tensorflow/core/common_runtime/gpu/gpu_device.cc:988]      0

2018-12-12 15:43:40.042873: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1001] 0:  N

2018-12-12 15:43:40.043042: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1115] Created TensorFlow device (/job:localhost/replica:0/task:0/device:GPU:0 with 9665 MB memory) -> physical GPU (device: 0, name: GeForce GTX 1080 Ti, pci bus id: 0000:02:00.0, compute capability: 6.1)

结果是:4

值为:4

则安装成功,其中

allow_soft_placement=True 表示使用不能使用显卡时使用cpu

log_device_placement=False 不打印日志,不然会刷屏

7、参考文献

TensorFlow安装指南

相关文章

网友评论

      本文标题:2019-02-15

      本文链接:https://www.haomeiwen.com/subject/ourveqtx.html