手把手教你在谷歌云平台搭建基于GPU的深度学习

[复制链接]
手把手教你在谷歌云平台搭建基于GPU的深度进修-1.jpg

大数据文摘授权转载自 数据派THU

作者:Saurabh Bodhe

编译:陈振东、车前子

我晓得,基于GPU的高真个深度进修系统构建起来很是高贵,而且不轻易获得,除非你……

https://hackernoon.com/deep-learning-with-google-cloud-platform-66ada9d7d029

假定你有一台带有GPU的裸机,固然倘使有些设置是预先设备好的,可以跳过下面部分教程。此外,我还假定你有一个NVIDIA的显卡,我们在本教程中只会商若何设置TensorFlow,也就是今朝最受接待的深度进修框架(向谷歌致敬!)

安装CUDA驱动法式

CUDA是NVIDIA开辟的一个并行计较平台,是搭建TensorFlow的根基条件。可是我们前面会提到,现实上最好利用逆向工作的方式,所以我们稍后再回到这部分。

安装TensorFlow

启动终端(假如是远程拜候的话,就利用SSH)。总之,找到特定利用法式(倘使有的话)所需的TensorFlow版本,大概假如没有这样的限制,可以利用我今朝利用的TensorFlow 1.8.0。
pip install tensorflow-gpu==1.8.0
在TensorFlow安装的时辰,我们运转下Python shell
python
在Python shell中输入下面的代码:
import tensorflow as tf
但这时我们还没有安装CUDA,你会看到类似下面的报错:
ImportError: libcublas.so.9.0: cannot open shared object file: No such file or directory
9.0版本、文件名大概是其他的报错,这取决于您挑选的TensorFlow版本。可是这样做的目标是晓得我们需要哪个版本的CUDA,在这个例子中是9.0。官方文档中TF版本和CUDA版本的对应关系不是很清楚,所以我一向感觉这类逆向工程方式更好。

然后,我们再回到CUDA的安装。利用
exit()
退出Python shell。

安装CUDA驱动(相信我,此次是真的安装)

按照之前的操纵,挑选你需要的版本:
Linux->x86_64->Ubuntu->16.04 (or 17.04)->deb (network)
下载响应的.deb文件,并依照NVIDIA的官方说明安装CUDA。完成以后,让我们检查下能否一切一般。

再次翻开Python shell并运转下面的代码,
import tensorflow as tf
固然,我们还没有完成,此次你会看到稍微分歧的报错(假如在此之前就出现了类似的报错,参考下面的“Troubleshooting”中的修复方式)
ImportError: libcudnn.so.7: cannot open shared object file: No such file or directory
我们还需要NVIDIA供给的一个叫做cuDNN的库,它可以利用GPU加速深度神经收集的计较。留意,本教程中的cuDNN版本是7.0。

翻开并注册一个帐户(免费的):

https://developer.nvidia.com/cudnn

注册好帐号后,登录:

https://developer.nvidia.com/rdp/cudnn-archive。

挑选你需要的cuDNN版本,并确保你挑选该版本所对应的CUDA版本。在本教程中,我们需要下载以下版本,
Download cuDNN v7.0.5 (Dec 5, 2017), for CUDA 9.0
鄙人拉选项当挑选,
cuDNN v7.0.5 Library for Linux
这样,.tgz文件就起头下载了,将文件存储到你的机械上,并利用以下号令停止提取,
tar -xzvf <CUDNN_TAR_FILENAME>
终极提取出一个名为“CUDA”的文件夹,切换到该目录,并履行下面两条号令,
sudo cp lib64/* /usr/local/cuda/lib64/sudo cp include/cudnn.h /usr/local/cuda/include/
这样就完成了(希望如此)。再次启动Python shell,此次你晓得该做什么。

假如此次运转没有报错,那就没题目了。

为确保TensorFlow可以检测到GPU,在Python shell中利用以下代码,
tf.test.gpu_device_name()
它将会把一切可用的GPU显现出来。假如这个号令在旧版本的TF能够运转不了,可以试试下面的号令。
nvidia-smi
题目修复

假如一切设置都正确,nvidia-smi也可以履行,但TensorFlow照旧报出不异的毛病,那末很有能够情况变量出了题目。履行下面的号令停止修复:
export LD_LIBRARY_PATH=/usr/local/cuda/lib64:${LD_LIBRARY_PATH}export PATH=/usr/local/cuda/lib64:${PATH}
假如nvidia-smi号令都没法履行,CUDA没有正确安装,那就重新安装设置一遍,看看有没有什么遗漏的地方。

接待大师提问,倡议大概批评。

祝好。
温馨提示:
好向圈www.kuaixunai.com是各行业经验分享交流社区,你可以在这里发布交流经验,也可以发布需求与服务,经验圈子里面禁止带推广链接、联系方式、违法词等,违规将封禁账号,相关产品信息将永久不予以通过,同时有需要可以发布在自己的免费建站官网里面或者广告圈, 下载好向圈APP可以加入各行业交流群 本文不代表好向圈的观点和立场,如有侵权请下载好向圈APP联系在线客服进行核实处理。
审核说明:好向圈社区鼓励原创内容发布,如果有从别的地方拷贝复制将不予以通过,原创优质内容搜索引擎会100%收录,运营人员将严格按照上述情况进行审核,望告知!
回复

使用道具 举报

已有(8)人评论

跳转到指定楼层
372940303 发表于 2021-3-24 12:58:01
转发了
回复

使用道具 举报

yezi66666 发表于 2021-3-25 09:43:06
转发了
回复

使用道具 举报

gmyxa 发表于 2021-3-26 05:57:07
不用这么麻烦,安装显卡驱动后,使用anaconda安装tensorflow,会自动将依赖的包安装好。
回复

使用道具 举报

lunna0227 发表于 2021-3-26 18:22:14
转发了
回复

使用道具 举报

我心久居一片海 发表于 2021-3-27 20:25:46
转发了
回复

使用道具 举报

旖俏 发表于 2021-3-28 13:59:16
我的tensorflow检测不到gpu,能不能帮忙指导一下?
回复

使用道具 举报

nakatahao 发表于 2021-3-29 02:03:29
转发了
回复

使用道具 举报

鲜艳桂圆 发表于 2021-3-30 05:25:10
转发了
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

24小时热文