您的位置 首页 > 数码极客

[如何测试显存]如何测试显存是否坏了…

GPU资源对深度神经网络的训练十分重要,在程序运行时可能会出现cuda runtime error(2): out of memory,显存不足。有时时因为网络结构太大造成的,而有些时候是因为处理复杂逻辑时,某个变量累加或者没有及时释放掉,占用了大量的显存空间,这时查找时非常费力的,那么如何快速查找到底那个变量占用过高的显存呢?

Pytorch-Memory-Utils是pytorch框架下用来监测显存的工具(),基于pynvml库来实现显卡信息的获取。通过定义两个标志位,把想要监测的代码块放入标志位中间,即可加入监测队列。

然后会在当前目录下自动生成检测日志

责任编辑: 鲁达

1.内容基于多重复合算法人工智能语言模型创作,旨在以深度学习研究为目的传播信息知识,内容观点与本网站无关,反馈举报请
2.仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证;
3.本站属于非营利性站点无毒无广告,请读者放心使用!

“如何测试显存,如何测试显存是否坏了,如何测试显存哪个颗粒坏了,如何测试显存温度,如何测试显存好坏”边界阅读