python - 任务期间的 Dask 进度
问题描述
使用 dask 数据框
df = dask.dataframe.from_pandas(df, npartitions=5)
series = df.apply(func)
future = client.compute(series)
progress(future)
在 jupyter 笔记本中,我可以看到每个分区完成多少 apply() 调用的进度条(例如 2/5)。
dask 有没有办法报告每个分区内的进度?
类似于tqdm
progress_apply()
熊猫的东西。
解决方案
如果您的意思是,每次调用的完成程度如何func()
,那么不,Dask 无法知道这一点。Dask调用在自己的python线程中运行的python函数(python线程不能被另一个线程中断),而Dask只知道调用是否完成。
您也许可以设想调用一个具有一些内部回调或其他报告系统的函数,但我认为我没有见过这样的事情。
推荐阅读
- javascript - Bootstrap.css 和 Vendors.min.js 正在为 Asp.net webforms 中的自动完成文本框创建问题
- c++ - 不能使用尾随返回和模板将函数分离为声明和定义
- spring-boot - 如何为 loadUserByUsername 方法编写模拟测试
- c++ - 使用 std::source_location 报告错误的最佳实践
- sql - 根据类别为药物创建序列号列
- node.js - Firebase - 部署时云功能未运行
- r - 使用 SMOTE 创建 1:1 平衡数据集,而不修改 R 中多数类的观察结果
- amazon-web-services - 如何找出导致我的 EC2 实例无法访问的原因?
- python - 声音分贝输出 Python
- plugins - 分页添加插件