python - Dask DataFrame 中的客户端与 python | client.shutdown()
问题描述
我一直在使用dask ,当您处理具有高计算要求的大型脚本时,我有一个与客户端相关的问题
client = Client(n_workers = NUM_PARALLEL)
...
more code
...
client.shutdown()
我见过一些人在进程中间关闭客户端然后再次初始化它,这对速度有好处吗?
另一方面,工作人员内存不足,您知道将 dask 数据帧计算几次而不是最后只计算一次是否是一种好习惯,这可能超出了 pc 的性能容量.
解决方案
我见过一些人在进程中间关闭客户端然后再次初始化它,这对速度有好处吗?
IIUC,对速度没有影响,启动调度程序/集群的时间可能会稍微变慢。唯一的一点好处是,如果您正在共享资源,那么关闭集群将释放资源。
另一方面,工作人员内存不足,您知道将 dask 数据帧计算几次而不是最后只计算一次是否是一种好习惯,这可能超出了 pc 的性能容量.
这实际上取决于 DAG,如果它减少了分区/任务的数量,特别是如果某些结果被多次计算,那么在中间步骤计算可能会有优势。
推荐阅读
- reactjs - Material UI 默认主题覆盖自定义主题
- python-3.x - 删除列表中出现超过 2 次的元素
- python - Python 将 JSON 重构为不同的 JSON 结构
- javascript - SuiteScript 1.0 nlapiGetLineItemCount
- azure - Azure PSContainerGroup 有哪些可能的状态
- google-apps-script - 有没有办法让用户使用脚本编辑另一个电子表格并同时隐藏它?
- c++ - 向量搜索
- android - 在 android 9 及更高版本中,RelativeLayout 中的 RecyclerView 不滚动
- python - 如何在没有 MSI 安装程序的情况下在 Windows 上安装 python?
- node.js - 通过 node.js 服务器上的 http 请求获取 LinkedIn 访问令牌