Ubuntu 24.04 安装 NVIDIA Container Toolkit 全指南:让Docker拥抱GPU ...

打印 上一主题 下一主题

主题 873|帖子 873|积分 2619

前言

在使用Docker运行必要GPU加速的AI应用时,大概会遇到报错:
docker: Error response from daemon: could not select device driver "" with capabilities: [[gpu]]
这是因为缺少 NVIDIA Container Toolkit —— 它是让容器访问宿主GPU的关键桥梁。
本文将以Ubuntu 24.04 (Noble Numbat)为例,手把手教你完成完整安装流程。

一、环境预备

1.1 验证驱动状态

  1. nvidia-smi
复制代码
成功时会显示类似以下输出(注意右上角的CUDA版本)

二、安装NVIDIA Container Toolkit

2.1 添加官方仓库

  1. # 安装依赖
  2. sudo apt-get update
  3. sudo apt-get install -y curl
  4. # 添加密钥和仓库
  5. curl -fsSL https://nvidia.github.io/libnvidia-container/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-container-toolkit-keyring.gpg
  6. curl -s -L https://nvidia.github.io/libnvidia-container/stable/deb/nvidia-container-toolkit.list | \
  7.   sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-container-toolkit-keyring.gpg] https://#g' | \
  8.   sudo tee /etc/apt/sources.list.d/nvidia-container-toolkit.list
复制代码
2.2 执行安装

  1. sudo apt-get update
  2. sudo apt-get install -y nvidia-container-toolkit
复制代码

三、设置Docker运行时

3.1 更新Docker设置

  1. # 生成配置文件
  2. sudo nvidia-ctk runtime configure --runtime=docker
  3. # 重启Docker服务
  4. sudo systemctl restart docker
复制代码

四、验证安装效果

4.1 运行测试容器

  1. docker run --rm --gpus all nvidia/cuda:12.6.0-base-ubuntu24.04 nvidia-smi
复制代码
成功时会看到与宿主机雷同的GPU信息输出。

五、实战应用

如今可以运行你的GPU容器应用了!例如:
  1. docker run --gpus all -p 8880:8880 ghcr.io/remsky/kokoro-fastapi-gpu:latest
复制代码

   技术总结:本文介绍了在Ubuntu 24.04中设置GPU容器支持的全流程,涵盖了驱动安装、工具链设置和验证测试。假如您在操作中遇到题目,欢迎在评论区留言讨论!

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
回复

使用道具 举报

0 个回复

正序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

九天猎人

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表