AI编程: 一个案例对比CPU和GPU在深度学习方面的性能差异 ...

打印 上一主题 下一主题

主题 942|帖子 942|积分 2826

配景

字节跳动正式发布中国首个AI原生集成开发情况工具(AI IDE)——AI编程工具Trae国内版。 该工具模型搭载doubao-1.5-pro,支持切换满血版DeepSeek R1&V3, 可以资助各阶段开发者与AI流畅协作,更快、更高质量地完成编程工作,提升开发服从。
安装试用后,效果确实不错,无论是编程还是开发情况的主动化构建,都能实现较高程度的主动化。
本文演示了一个实际编程案例,在一台配备Intel CPU和集成显卡的个人PC上,对比GPU/CPU在一些耗时运算方面的性能差异,并通过图表展示对比效果。涉及基本的神经网络模型 编程,如python情况配置、矩阵运算、前向传播、反向传播,基于Intel集成显卡GPU的开发情况配置等。
运行情况

builder模式实施任务

向Trae形貌任务需求

本机是 i7-1260P + Iris Xe + 16G内存, 请编写程序,对比一下使用CPU和GPU进行某些深度学习运算的性能差异。
只需根几秒的时间, trae就已经完成了代码编写 gpu_cpu_benchmark.py,并输出了python情况依赖库清单requirements.txt

生成依赖并主动安装

requirements.txt如下图所示,当然,依赖文件并不是一步到位 直接生成的。而是经历了多个版本的叠代。

好比 ,一开始trae推荐的是以下版本的torch
  1. pip install torch==2.3.0 torchvision==0.18.0 intel-extension-for-pytorch==2.3.0 memory-profiler==0.61
复制代码
但是因版本匹配题目失败,因此, trace又调整了软件包版本。
包括在使用intel集成显卡的时候与Nvidia GPU编程不同, trae提示:
检测到PyTorch安装需要额外源地点,现在添加Intel官方源重新安装依赖。
  1. pip install -r requirements.txt --extra-index-url https://pytorch-extension.intel.com/release-whl/stable/xpu/us/
复制代码

评测程序运行

测评程序分别使用cpu、XPU(即intel的集成显卡)进行矩阵运算、前向传播、反向传播等方面的运算。

GPU满负荷工作:

评测效果

评测程序最终主动输出了评测效果,如下图所示。效果表明, 这台集成显卡的GPU性能着实一样平常, 只有矩阵运算比CPU强,其他方面如前向传播、反向传播和内存使用,都比CPU要弱。后续有时机换个显卡再试。
这台集成显卡的GPU性能着实一样平常, 只有矩阵运算比CPU强,其他方面如前向传播、反向传播和内存使用,都比CPU要弱。后续有时机换个显卡再试。


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

正序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

曹旭辉

金牌会员
这个人很懒什么都没写!
快速回复 返回顶部 返回列表