PyTorch DistributedDataParallel 多卡训练结果变差

查看 25|回复 0
作者:yiyi1010   
本想使用多卡训练,训练结果应该会更加好,但是我发现使用三张 3090 训练,网络模型不收敛, 这是因为学习率的原因吗?
您需要登录后才可以回帖 登录 | 立即注册

返回顶部