python - Pytorch 在错误的行上使 cuda 崩溃
问题描述
如何在 Pytorch 中查看哪条 python 行导致 cuda 崩溃,它在 GIL 之外执行异步代码?
这是一个案例,我有 Pytorch 崩溃 cuda,在这个数据集上运行这段代码,每次运行都会在不同的 python 行上与调试器一起崩溃,这使得调试变得非常困难。
解决方案
我在论坛的一个完全不相关的帖子中找到了答案。找不到可在 Google 上搜索的答案,因此为了将来的用户而在此处发布。
由于 CUDA 调用是异步执行的,因此您应该使用
CUDA_LAUNCH_BLOCKING=1 python script.py
这可以确保正确的代码行会抛出错误消息。
推荐阅读
- javascript - 为什么 .setHours(0,0,0,0) 会导致 T07:00:00.000Z
- python - Keras:如何确定在哪个迭代中保存了最佳 val 模型?
- javascript - 我正在做一个在 javascript 上做的应用程序,但是当我再添加一个要做的事情时,值 undefined
- java - 退出 for 循环后数组变为空
- javascript - 由于未定义,控制器功能中的 res 失败
- angular - 在 Angular 中使用带有多个相同组件实例的引导程序的响应式屏幕
- apache-kafka - 对Kafka的exactly-once语义感到困惑
- angular - 如何在 ngx-chart-line-chart 工具提示上对值进行排序
- python - 两个类在 HTML 中具有相同的名称,而 BeautifulSoup 只选择第一个类
- javascript - 重构 react/node 如何处理响应