悠扬随风 发表于 2024-12-27 08:24:22

RuntimeError: CUDA error: initialization

RuntimeError: CUDA error: initialization


cuda初始化出问题了,这是由于在python多线程跑gpu代码步伐时先对cuda举行操纵,然后在跑gpu代码时就没有cuda可用了。
在main的主步伐代码加一行代码就可以了,用来获取cuda,在代码中只能使用一次:
import multiprocessing as mp

if __name__ == "__main__":
    mp.set_start_method('spawn')
多历程推理代码:


import os

os.environ['CUDA_VISIBLE_DEVICES']='0'

import torch
import multiprocessing

# 定义每个进程要执行的函数,这里简单做一个张量求和计算示例
def process_task(gpu_id, tensor_data):
    # 设置当前进程可见的CUDA设备
    # os.environ['CUDA_VISIBLE_DEVICES'] = str(gpu_id)
    print("gpu_id",gpu_id)
    device= torch.device(f"cuda:{gpu_id}")
    seed=1234
    generator = torch.Generator(device).manual_seed(seed)
   
    # device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
    tensor = tensor_data.to(device)
    result = tensor.sum()
    return result.item()

if __name__ == "__main__":
    num_processes = 5# 定义要启动的进程数量,这里设置为2,可根据实际GPU数量等情况调整
    gpu_ids = # 对应每个进程使用的GPU设备编号,需根据实际系统中的GPU情况安排
    tensor_list = # 模拟每个进程要处理的张量数据

    with multiprocessing.Pool(num_processes) as pool:
      args_list = [(gpu_id, tensor) for gpu_id, tensor in zip(gpu_ids, tensor_list)]
      results = pool.starmap(process_task, args_list)

    print("各个进程的计算结果:", results)

免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!更多信息从访问主页:qidao123.com:ToB企服之家,中国第一个企服评测及商务社交产业平台。
页: [1]
查看完整版本: RuntimeError: CUDA error: initialization