dask - Distributed.worker 内存使用率很高,但 worker 没有数据要存储到磁盘
问题描述
distributed.worker - WARNING - Memory use is high but worker has no data to store to disk. Perhaps some other process is leaking memory? Process memory: 3.91 GB -- Worker memory limit: 2.00 GB
distributed.worker - WARNING - Worker is at 41% memory usage. Resuming worker. Process memory: 825.12 MB -- Worker memory limit: 2.00 GB
当我尝试运行一段将算法应用于我拥有的数据集的代码时,会出现上述错误。在阅读了 https://distributed.dask.org/en/latest/worker.html上的文档后,我仍然不清楚这个错误会对这个应用程序的结果产生什么影响。这只会影响此代码的速度或效率,还是会影响我的结果?
解决方案
该警告表示您的进程占用的内存比您所说的要多得多。在这种情况下,Dask 可能会暂停执行,甚至开始重新启动您的工作人员。
警告还说 Dask 本身没有保留任何数据,因此它可以做的事情不多(比如删除它的数据)。我的猜测是您正在使用的某些库占用了大量内存。您可能希望使用内存超过 2GB 的 Dask 工作程序。
推荐阅读
- python - Tensorflow - 如何创建可变大小的神经网络
- c# - 如何使用 MS bot 框架从 Teams 私人消息中获取用户上下文
- vba - 将公式插入单元格时,如何清除此 ByRef 参数类型不匹配错误?
- jquery - 我们怎么说“在 load() 函数做某事之前”
- json - 找不到使用 Json 的类的序列化程序
- r - 用字母替换R中数据框中的零和一
- c# - 在 ASP.NET Core MVC 2.1 中将用户消息从我的站点发送到我的电子邮件
- shadow-dom - 我可以在 Shadow DOM 中获得一个按钮来提交不在 Shadow DOM 中的表单吗?
- javascript - 这可以变成一个for循环吗?
- node.js - 运行 Mocha 测试时 node-mssql “连接已关闭”,但在应用程序中运行良好