首页 > 其他 > 详细

显存不足造成nan错误

时间:2021-07-09 00:31:22      阅读:25      评论:0      收藏:0      [点我收藏+]

用MMDetection训练过程中,全连接层(Fully Connected Layers,FC)出现nan错误,但是全连接层只是线性组合,而且数值也不大,也没有计算损失函数,怎么可能出现nan错误?

经过研究发现,原来是显存不足造成的,由于显存不足,有些tensor没有了,就造成了nan错误,进行了如下设置:

samples_per_gpu=1,
workers_per_gpu=1,

把1个GPU训练2个samples,改成了1个GPU训练1个sample,这个错误就消失了.

 

显存不足造成nan错误

原文:https://www.cnblogs.com/mstk/p/14988201.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!