parallel-processing - 在 Dask 中测量任务调度程序图的并行性
问题描述
如果我有一个大型自定义任务图输入 Dask,以及每个任务将花费的时间列表(例如,在最简单的情况下,每个任务可能花费相同数量的 CPU 秒/分钟),有没有办法计算如何“可并行化”问题出在图的结构上,而没有实际运行任务?假设与每个任务的时间相比,计算调度优先级等的时间可以忽略不计。
我正在考虑一个指标,要么绘制一段时间内使用的并行进程的数量(假设有无限数量的可用内核),要么绘制整个图表所需的小时数,给定固定数量的 CPU 内核。
如果不是这样,能够为任务调度程序提供这似乎是一件好事,特别是如果单个任务预计需要几分钟或几小时。但是,我想可能很难进行分析计算,具体取决于 Dask 中的基本任务分配算法。
解决方案
推荐阅读
- pytorch - 为什么代码 A 运行良好而 B 出错?
- json - 如何在不捆绑的情况下使用包裹提供 json 文件?
- python - 如何在 Pandas 上使用参考初始时间戳对 30 分钟的会话进行分组?
- facebook - Facebook 到 Twitter 的连接已断开。有解决方法吗?
- javascript - 使用 reactjs 从本地存储更新我的组件数据
- nestjs - 当涉及来自不同兄弟的不同服务时,Nest 无法解决服务依赖关系
- reactjs - npm 中的 127.0.0.1 live-server 无法在任何浏览器中打开。这里有什么问题?
- c++ - 为什么带有`cout`的条件被评估为真?
- c - 如何在多线程 C/C++ 程序中正确重启套接字
- machine-learning - 编码或映射