llama-cpp-python当地摆设并利用gpu版本

瑞星 · 2025-2-15 14:38:42

利用带编译的下令安装llama库

# 首选 GGML_CUDA 后续LLAMA_CUBLAS将删除
CMAKE_ARGS="-DGGML_CUDA=on" FORCE_CMAKE=1 pip install llama-cpp-python --no-cache-dir
CMAKE_ARGS="-DLLAMA_CUBLAS=on" FORCE_CMAKE=1 pip install llama-cpp-python --no-cache-dir

复制代码

如果仅利用pip install llama-cpp-python会仅利用cpu运行。
而且利用LLAMA_CUBLAS 大概会出现以下错误

_*** CMake configuration failed
[end of output]
note: This error originates from a subprocess, and is likely not a problem with pip.
ERROR: Failed building wheel for llama-cpp-python
Failed to build llama-cpp-python
ERROR: Could not build wheels for llama-cpp-python, which is required to install pyproject.toml-based projects_

复制代码

下载torch当地很慢，加速本领（linux）：

复制代码

aria2c -x 16 -s 16 https://download.pytorch.org/whl/cu121/torch-2.5.0%2Bcu121-cp312-cp312-linux_x86_64.whl

复制代码

实时查看nvidia显卡占用信息 :

复制代码

免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！更多信息从访问主页：qidao123.com:ToB企服之家，中国第一个企服评测及商务社交产业平台。

		自动登录	找回密码
密码			立即注册

0 个回复