# [optional] finish the wandb run, necessary in notebooks
wandb.finish()
复制代码
6.查看
数据简单说明:
Process GPU Power Usage (W): GPU功率利用情况,以瓦特(W)为单位。
Process GPU Power Usage (%): GPU功率利用占GPU总功率的百分比。
Process GPU Memory Allocated (bytes): 分配给训练过程的GPU内存量,以字节为单位。
Process GPU Memory Allocated (%): 分配给训练过程的GPU内存占GPU总内存的百分比。
Process GPU Time Spent Accessing Memory (%): 训练过程中访问GPU内存的时间百分比。
Process GPU Temp (°C): GPU温度,以摄氏度(°C)为单位。
2 TensorBoard
Visualizing Models, Data, and Training with TensorBoard — PyTorch Tutorials 2.5.0+cu124 documentation
1.安装
尽可能利用新版本的pytorch
pip install tensorboard
复制代码
利用的时候不要设置参数
在创建实例对象不要实行logdir目次
# 导入训练过程可视化工具tensorboard
from torch.utils.tensorboard import Summarywriter
# writer will output to ./tblogs/ directory by default
writer=SummaryWriter()
复制代码
启动时tensorboard:
tensorboard --logdir=runs
复制代码
不要在IDE(如vsCode)里面安装tensorboard插件
运行时报错:TensorFlow installation not found - running with reduced feature set. Serving TensorBoard on localhost; to expose to the network, use a proxy or pass --bind_all
解决:安装TensorFlow