笔记本电脑本地部署ollama大模型(显存不敷调用CUDA Unified Memory方法) ...

打印 上一主题 下一主题

主题 1982|帖子 1982|积分 5946

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

x
软硬件:win11,NVIDIA GeForce RTX 3050 显存4g

一.ollama模型最低要求

1. Llama 3.1 (8B) 模型



  • GPU: 至少必要 1 张具有 16 GB 显存的 GPU(比方 NVIDIA Tesla V100 或 A100)。
  • CPU: 高性能的多核处置处罚器(比方 Intel Xeon 或 AMD Ryzen)。
  • 内存: 最少 32 GB 的系统内存。
  • 存储: 必要约莫 4.7 GB 的存储空间用于模型文件。
2. Llama 3.1 (70B) 模型



  • GPU: 至少必要 4 张具有 40 GB 或更高显存的 GPU(比方 NVIDIA A100 或 H100)。可以采用分布式计算方式来处置处罚。
  • CPU: 高性能的多核处置处罚器(比方 Intel Xeon 或 AMD EPYC),推荐使用多台服务器。
  • 内存: 至少 256 GB 的系统内存。
  • 存储: 必要约莫 96 GB 的存储空间用于模型文件,发起使用高速 SSD。
3. Llama 3.1 (405B) 模型



  • GPU: 必要大规模的 GPU 集群,通常包括数十张具有 80 GB 或更多显存的 GPU(比方 NVIDIA A100 或 H100)。必要专门的硬件设置和高性能计算设施。
  • CPU: 高性能的多核处置处罚器(比方 Intel Xeon 或 AMD EPYC),而且必要多个处置处罚节点来支持分布式计算。
  • 内存: 至少 1 TB 或更多的系统内存。
  • 存储: 必要几百 GB 到 TB 级别的存储空间,发起使用高速 SSD 或分布式存储系统。
对于我们普通人的电脑,ollama模型的部署,你至少拥有一张有显存的n系显卡,再者就是电脑内存一定要在16g及以上

我的硬件信息,有两张8g的内存,一张英伟达显存为4g的3050显卡
  1. 查看内存信息:wmic memorychip get capacity, devicelocator, manufacturer, memorytype, speed
  2. 查看GPU的信息:nvidia-smi
复制代码

二.cuda和cudnn的安装(办理显存不敷的办法)

CUDA Unified Memory: CUDA 提供了统一内存(Unified Memory),允许 GPU 和 CPU 共享内存空间。这可以使得内存需求超出 GPU 显存时,数据可以存储在主机内存中并在必要时传输到 GPU。
1.cuda的选择与安装
1.打开NVIDIA控制面板>>>系统信息>>>组件
就这个:

可以看到我的是nvduda64.dll NVIDIA cuda 12.6.41 driver

2.进官网,选择相应的cuda,选择版本应该=<本身的版本NVIDIA cuda 12.6.41 driver:CUDA Toolkit Archive | NVIDIA Developer

3.选择本地exe安装

4.双击安装包,自定义设置,勾选组件:

继续点下一步
点击关闭,安装结束
验证:cmd输入
  1. 最高版本:nvidia-smi
  2. 当前版本:nvcc --version
复制代码

结果:

2.cudnn的安装
网址:https://developer.nvidia.com/cudnn-downloads?target_os=Windows
多版本:cuDNN Archive | NVIDIA Developer

下载的是一个压缩包,解压至你想保存的位置,并将解压的目次中的bin目次添加到环境变量里的系统变量path里面
这是我解压的bin文件夹位置:
  1. D:\app\cudnn\bin
复制代码

验证是否乐成:
找到你的这个目次,并将下面的变量添加到环境变量里的系统变量path里面
  1. C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.4\extras\demo_suite
复制代码

打开cmd,分别输入
  1. bandwidthTest.exe 
  2. deviceQuery.exe
复制代码

结果:


三.安装ollama

官网:Ollama

双击安装,默认会安到c盘,似乎也没法改,但是看了一下也不是很大,大的是模型,待会会说怎么改模型的存储位置,install,等安装完:

它会自动启动

打开cmd,不用设置path啥的,输入下面两个代码看一下结果:
  1. ollama
  2. ollama list
复制代码

OK啦
四.模型的选择和默认模型存储位置的更改

ollama官方提供的模型:llama3.1
小黄脸hugging face的模型(模型社区),有别人训练好的模型:https://huggingface.co/
模型的选择
1.更改模型下载位置

创建一个想要你想要保存模型的位置

添加系统环境变量
  1. 变量名:OLLAMA_MODELS
  2. 变量值:D:\app\OLLAMA_MODELS
复制代码
2.ollama的模型下载

8b模型是我们目前能运行的最大模型

复制指令,cmd中输入,等下载完

上一步设置无误的话,下载文件会有在你的模型存储位置会有两个这样的文件

下载完后,它本身会启动,试着对话一下,照旧很顺畅的





免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复

使用道具 举报

0 个回复

倒序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

立山

论坛元老
这个人很懒什么都没写!
快速回复 返回顶部 返回列表