python - pandas 的并行处理与 dask 相比如何?
问题描述
希望这个问题不要太宽泛:
我目前正在试验 dask(或一般的并行处理),我无法完全理解 dask 在数据处理方面提供的好处。特别是与使用 pandas 和多处理库并行化数据处理相比。我的谷歌技能不会揭示两者之间的任何公平比较。
仅仅是易用性还是它还提供了更好的速度/记忆效率?
解决方案
推荐阅读
- windows - 安装包(Chocolatey)时环境变量设置在哪里?
- c# - 将双精度转换为日期?
- typescript - 是否可以基于另一个属性值来暗示类属性类型?
- intellij-idea - 在 intellij 中重新格式化不支持的文件
- visual-studio-code - 我打破了什么,VS Code 现在抱怨 Azure Devops 生成的 Readme 降价
- c# - 将代表 zip 文件的字节 [] 从一个 API 发送到另一个 API
- mysql - 对 MySql 的 DLookUp 查询
- oauth - 如何使用 ADFS API 创建 ADFS 会话
- javascript - 您可以使用 .push 以外的方式将字符串放入数组中吗?
- php - 插入表格但避免多列重复