pytorch - 训练 OpenAI 点唱机上采样器时,损失值会在一段时间后变得疯狂
问题描述
在使用 OpenAI Jukebox 训练上采样器时,在第一个 epoch 结束时(大约 2 天后)有更多的“反向溢出”消息,最终损失值跃升 20。可能是什么问题?使用相同数据的 VQVAE 训练没有任何问题。
98% 28837/29318 [51:38:38<51:38, 6.44s/it, bpd=5.07, g_l=5.07, gn=43.4, l=5.07, p_l=0]
Warning. Loss is 25.929014205932617
Overflow in backward. Loss 25.929014205932617, grad norm nan, lgscale -7.203999999995833, new lgscale -8.203999999995833
98% 28838/29318 [51:38:45<51:46, 6.47s/it, bpd=5.07, g_l=5.07, gn=43.4, l=5.07, p_l=0]
Warning. Loss is 26.65635871887207
98% 28838/29318 [51:38:52<51:46, 6.47s/it, bpd=26.7, g_l=26.7, gn=1.01e+8, l=26.7, p_l=0]
98% 28839/29318 [51:38:52<53:08, 6.66s/it, bpd=26.7, g_l=26.7, gn=1.01e+8, l=26.7, p_l=0]```
解决方案
推荐阅读
- r - 在 R 中,对于满足多个字符串条件的单元格
- c# - 执行 CompareFileAsync 时输出“ChecksumNotSupported”FluentFTP
- java - 如何将 Enum.values() 映射/收集到 HashMap
> - javascript - 如何让 Phaser 3 timerEvent 和方法正常工作?并在游戏开始时让对象已经实例化?
- node.js - webpack 命令无法识别
- python - 获取列表中嵌套元素的所有排列-python 2
- c++ - 使用getch后如何在另一个字符串的末尾连接一个字符串
- xslt - 从 Xml 中删除重复元素,并且不应删除 XSLT 中的空值
- python - 从相邻文件夹中读取图像
- verilog - 设计 cpu 但价值没有在 verilog 中移动