python - KilledWorker 异常
问题描述
我正在使用线圈来启动集群并使用 dask 对从 S3 存储桶读取的 csv 进行一些操作。然而,在某些时候,我的工人被杀了。当我检查日志时,以下任务正在杀死它们。
distributed.scheduler - INFO - Task ('read-csv-values-values-00474dd1e867972e5b6636ffb4e71705', 65, 0) marked as failed because 3 workers died while trying to run it
distributed.scheduler - INFO - Task ('read-csv-values-values-00474dd1e867972e5b6636ffb4e71705', 70, 0) marked as failed because 3 workers died while trying to run it
distributed.scheduler - INFO - Task ('read-csv-values-values-00474dd1e867972e5b6636ffb4e71705', 71, 0) marked as failed because 3 workers died while trying to run it
distributed.scheduler - INFO - Task ('read-csv-values-values-00474dd1e867972e5b6636ffb4e71705', 86, 0) marked as failed because 3 workers died while trying to run it
distributed.scheduler - INFO - Task ('read-csv-values-values-00474dd1e867972e5b6636ffb4e71705', 1, 0) marked as failed because 3 workers died while trying to run it
distributed.scheduler - INFO - Task ('read-csv-values-values-00474dd1e867972e5b6636ffb4e71705', 8, 0) marked as failed because 3 workers died while trying to run it
distributed.scheduler - INFO - Task ('read-csv-values-values-00474dd1e867972e5b6636ffb4e71705', 45, 0) marked as failed because 3 workers died while trying to run it
distributed.scheduler - INFO - Task ('read-csv-values-values-00474dd1e867972e5b6636ffb4e71705', 39, 0) marked as failed because 3 workers died while trying to run it
所以,然后,我将 csv 从 s3 存储桶移到我的本地仓库并运行它,但读取的 csv 仍然会失败。
另一点是读取的 csv 对于先验数据操作正常工作,但对于一些虚拟编码器、.compute() 和日期操作,工作人员正在被杀死。
知道会发生什么吗?
解决方案
至少有两种可能:
工人没有足够的资源来执行他们的任务,一个常见的原因是内存不足;
任务本身是有问题的,例如(许多可能的原因之一)存在不匹配的数据类型,因此期望整数的函数无法使用 nan 执行计算。
为了尽量减少由于第二种可能性而导致任务失败的风险,最好在 pandas 数据帧上测试代码。
推荐阅读
- reactjs - 如何为 React 中的所有下拉菜单切换 SideBar?
- javascript - 为什么我的 discord.js 频道发送抛出错误?
- javascript - discord.js addrole 命令可能被版主滥用
- reactjs - 如何将 mp3 文件添加到反应 js 文件中
- reactjs - 我想看刚刚添加的评论
- django - 我们可以在django模型的字段中输入html代码吗?
- react-native - 反应原生。在标记旁边显示组件
- linux - 无法启动自定义内核 - mkinitpcio 不添加任何模块
- r - 在R中组合字符时只粘贴一次
- php - 如何存储已根据日期计算的每个数据,并且在 php 代码中创建的表中没有计划以显示