linux下 conda 和 pip 两种方式安装tensorflow(GPU)

立山  金牌会员 | 2025-3-10 22:59:44 | 显示全部楼层 | 阅读模式
打印 上一主题 下一主题

主题 983|帖子 983|积分 2949

在经历了不知道多少次的失败之后,终于看到步伐挂到gpu上跑出结果了。。。
深度学习做实行首选肯定还是pytorch,兼容性和便捷性都要比tensorflow强许多,官方给的安装指示很简洁易懂,安装经验也都很成熟。但没办法,一些范畴的开源代码大多数是用tensorflow框架开辟的,比如通讯。而且这些代码很少能把本身适配的环境在readme里说清晰的,只能硬着头皮嗑tensorflow安装。
说真话,tensorflow官网上那个安装写的那个安装教程就不是给人看的,试了Bazel之类的方法也失败了。网上的经验帖子也大多数都是Windows图形界面下针对tensorflow和cuda等库的安装,对用基于ssh远程控制linux服务器使用GPU在虚拟环境下举行学习实行的广大研友们非常不友好。因此,决定写一个帖子让有心的研友们看到后可以或许不在这上面走太多弯路。
tensorflow版本的选择

假如研究代码没有标明tensorflow版本,优先选用2.x版本。
首先,tensorflow1.x配套的python版本、硬件版本等都比力低。这会给代码运行速率、代码调试(如vscode插件)等方面带来麻烦。
其次,tensorflow2.x设置了对1.x比力友好的API接口,可以handle基于1.x写的代码。只要将import tensorflow as tf,换成
  1. import tensorflow._api.v2.compat.v1 as tf
复制代码
基本上就能解决许多1.x的运行问题。我个人选择的是2.15.0这一版,比力适配我需要跑的1.x的代码,本帖下面也以2.15.0版本为例。
假如研究代码标明tensorflow版本,一定要看好匹配的cuda和cudnn版本再安装。否则就会安装了半天发现根本没法用上GPU。具体版本对应参考这个帖子,写的很好:
https://blog.csdn.net/ly869915532/article/details/124542362
conda安装tensorflow

这个的前提是用conda装好虚拟环境,具体可以参考这个帖子:
https://blog.csdn.net/2301_81940605/article/details/136478382
装好之后即可开始tensorflow安装。
首先说明一点,conda是个好东西,它会把关联包按照版本比力严格的绑在一起,对于tensorflow而言基本不需要操心cuda和cudnn匹配了。 但假如想安装特定版本的tensorflow,还是需要在库里举行搜索确认的,即
  1. conda search tensorflow
复制代码
这时候会给出defaults通道下各个tensorflow版本,对应安装即可。假如没有找到所需版本,可以在差别的通道下搜索,如conda-forge
  1. conda search tensorflow
  2. -c conda-forge
复制代码
这时候你会发现版本多了起来,选定一个想要的举行安装,如
  1. conda install -c conda-forge tensorflow=2.15.0=cuda120py311h5cbd639_2
复制代码
安装好之后用conda list看看库里是不是把配套的包如cudnn等都装齐了,假如没有,看好匹配的版本逐一用conda安装即可,方式同上。
比力容易碰到的问题就是,不管是conda加载速率还是安装速率都特别特别慢,这些一般来说都是镜像源的问题。如今大多数帖子分享的清华源的方法好像不太好用了,推荐换北外源,具体操纵参考这个帖子,写的很好:
https://blog.csdn.net/weixin_43667077/article/details/108282523
pip安装tensorflow

pip相对于conda来说要麻烦许多,容易堕落的地方也更多,有条件的还是推荐用上面conda的方法。但可能一些情况下服务器平台不支持anaconda,因此,在这里给出pip安装的方法。
前提还是先装好虚拟环境,没有conda服务的话可以如许安装并激活
  1. python3 -m venv tf_env/                #python版本提前确认好
  2. source .../tf_env/bin/activate         #...表示tf_env所在路径
复制代码
pip不会像conda一样关联好干系的包,因此需要先参考tensorflow版本确定好cuda和cudnn的版本举行安装。但nvidia官方给出的cuda安装方式如apt install,很难仅仅设置到虚拟环境中,很不方便。找了半天终于发现官方给的pip安装方式,具体长如许

即先安装wheel和nvidia-pyindex
  1. python3 -m pip install --upgrade setuptools pip wheel
  2. python3 -m pip install nvidia-pyindex
复制代码
今后面举行的时候发现官方给的没有指定精确版本,

另外,按照官方给的格式本身写版本也很可能碰面临pip报搜索不到的错误。想了想,还是到pip通道PyPI中本身去搜索找最准确的版本吧。如nvcc,可以在这搜索到具体的版本和对应指令

差别版本可以在发行历史中举行选定即可,很方便。
我本人担心cuda配件装不完影响GPU运行,以是把2.15.0的所有配件都给装了,可以直接抄过去
  1. pip install nvidia-nvtx-cu12==12.5.82 nvidia-nvml-dev-cu12==12.5.82 nvidia-cufft-cu12==11.2.6.28 nvidia-cusolver-cu12==11.6.4.38 nvidia-nvjpeg-cu12==12.3.3.23 nvidia-npp-cu12==12.3.1.23 nvidia-cusparse-cu12==12.5.2.23 nvidia-curand-cu12==10.3.7.37 nvidia-cudnn-cu12==8.9.7.29 nvidia-cuda-runtime-cu12==12.5.82 nvidia-cuda-nvrtc-cu12==12.5.82 nvidia-cuda-nvcc-cu12==12.5.82 nvidia-cuda-cupti-cu12==12.5.82 nvidia-cuda-cccl-cu12==12.5.39.post1 nvidia-cublas-cu12==12.5.3.2
复制代码
最后,安装指定版本的tensorflow即可,方法同上,也可以在PyPI中搜索
  1. pip install tensorflow==2.15.0.post1
复制代码
至此,基于pip安装tensorflow大功告成。

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

立山

金牌会员
这个人很懒什么都没写!
快速回复 返回顶部 返回列表