f 运维.售后-【AI训练环境搭建】在Windows11上搭建WSL2+Ubuntu22.04+Tensorflow+GPU机器学习训练环境 - Powered by qidao123.com技术社区

【AI训练环境搭建】在Windows11上搭建WSL2+Ubuntu22.04+Tensorflow+GPU机器 ...

打印 上一主题 下一主题

主题 1957|帖子 1957|积分 5875

一、安装Ubuntu

拿到该文件Ubuntu-22.04.tar

通过wsl导入该假造机镜像,然后检察wsl假造机列表。
  1. wsl --import Ubuntu-22.04-tensorflow D:\wsl-data\Ubuntu-22.04-tensorflow D:\wsl-data\temp\Ubuntu-22.04.tar
  2. wsl -l
复制代码

进入假造机
  1. wsl -d Ubuntu-22.04-tensorflow
复制代码


二、Ubuntu安装anaconda

1. 复制下载链接

点此链接进入官网,右键复制链接,这是我复制到此链接(https://repo.anaconda.com/archive/Anaconda3-2024.10-1-Linux-x86_64.sh)
Download Now | Anaconda

2.通过wget下载anaconda

命令格式:wget [上面复制的xx.sh链接]
  1. wget https://repo.anaconda.com/archive/Anaconda3-2024.10-1-Linux-x86_64.sh
复制代码

下载完成

3.安装anaconda

实行安装命令,按回车健Enter确认安装
  1. sh Anaconda3-2024.10-1-Linux-x86_64.sh
复制代码

此时,按Page Down翻页快速阅读协议条款

输入yes同意协议条款

继续再按回车健Enter确认安装到/root/anaconda3,如果你想安装到别的目次可以直接输入(不外一般环境下不需要去改)

确认启动时更新和初始化


注意,此时运行conda -V提示没有conda命令,你只需要关闭cmd窗口再进入到unbuntu即可,如果你利用的是windows11,这里也会有快捷进入unbuntu的入口

再次验证conda -V,会输出版本号

至此,anaconda安装成功。
三、安装显卡驱动

注意不需要再再wsl-ubuntu上安装显卡驱动,只需要你的windows上安装好就行,直接运行nvidia-smi即可验证


由于第一次尝试和第二次尝试都失败了,若要快速搭建吗,可直接跳转至第六章节,你只需要注意添加conda清华源就行了。
四、【失败】第一次尝试:创建Conda+TensorFlow+GPU环境

1. 创建新的conda环境

conda环境名称为t1,python版本为3.10
  1. conda create -n t1 python=3.10
复制代码


2. 进入刚创建conda环境:t1


  1. conda activate t1
复制代码


3. 安装cudatoolkit和cudnn

安装cudatoolkit的11.2版本和cudnn的8.1版本
  1. conda install cudatoolkit=11.2 cudnn=8.1
复制代码

设置conda清华源

再来,可以下载了


4.安装tensorflow

 安装tensorflow的2.10.0版本(由于pip源是单独控制的,以是这里临时指定)
  1. pip install tensorflow==2.10.0 -i https://pypi.tuna.tsinghua.edu.cn/simple
复制代码
5. 安装tensorflow-gpu的2.10.0版本

  1. pip install tensorflow-gpu==2.10.0 -i https://pypi.tuna.tsinghua.edu.cn/simple
复制代码
6 降低numpy的版本到1.22.4

  1. pip install numpy==1.22.4 -i https://pypi.tuna.tsinghua.edu.cn/simple
复制代码
7. 利用GPU训练

1.克隆cnn-hello

  1. git clone https://gitee.com/fengyefly/cnn-hello
  2. cd cnn-hello/
复制代码

2.运行cnn-hello-train.py

  1. python cnn-hello-train.py
复制代码

发现未调用GPU!由于以上是再windows跑通的,再ubuntu下没必要按这个版本,下面尝试重新创建一个conda环境,然后用比较新的版本。(原因也可以看看下面这个官方说明)

退出conda t1环境
  1. conda deactivate
复制代码

五、【失败】第二次尝试:创建Conda+TensorFlow+GPU环境(python 12)

 1. 创建新的conda环境

conda环境名称为t2,这次我们利用python版本为3.12
  1. conda create -n t2 python=3.12
复制代码




2. 进入刚创建conda环境:t2

  1. conda activate t2
复制代码
3. 安装cudatoolkit和cudnn

  1. conda install cudatoolkit=12.5
  2. conda install cudnn=9.3
复制代码

4.安装tensorflow



  1. pip install tensorflow==2.19.0 -i https://pypi.tuna.tsinghua.edu.cn/simple
复制代码
5. 尝试利用GPU训练


六、【成功】第三次尝试:创建Conda+TensorFlow+GPU环境(python 12)

参阅了官网的教程,改进安装方案。
1.创建新的conda环境

  1. conda create -n t4 python=3.12
复制代码

2.安装tensorflow[and-cuda]

注意:此处的命令不但仅是tensorflow,而多了一个[and-cuda],意味着它会帮我们把cudatoolkit和cudnn主动装好。
  1. pip install tensorflow[and-cuda]
复制代码

 3.验证GPU

实行该命令,可以看到成功加载到GPU。
  1. python3 -c "import tensorflow as tf; print(tf.config.list_physical_devices('GPU'))"
复制代码


 七. 利用GPU训练速度体验

1.克隆cnn-hello

  1. git clone https://gitee.com/fengyefly/cnn-hello
  2. cd cnn-hello/
复制代码

2.运行cnn-hello-train.py

  1. python cnn-hello-train.py
复制代码

 履历证,训练用时约13s,和我在windows上直接用conda安装的环境下,用时非常接近!

至此,已经完成在Windows11上搭建WSL2+Ubuntu22.04+Tensorflow+GPU机器学习训练环境。感谢阅读!真材实料的实践分享,别忘记给个点赞哦

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

东湖之滨

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表