dask - 从索引未排序的数据帧加载后的dask排序索引
问题描述
我用熊猫创建了带有非排序索引的数据框并将其保存到镶木地板。稍后,如果我使用 dask 加载,如何执行排序索引?我必须做类似的事情
pdf.reset_index().set_index(idx)
吗?
解决方案
据我所知,答案是肯定的,你的方法是正确的。例如,"sort_index"
在 Dask 中搜索问题并不会真正产生任何相关结果。
请记住,核外排序是一项相当困难的操作。如果您的数据集适合您的内存,您可能会在 Pandas 中获得更稳定的结果(甚至更好的性能)。
推荐阅读
- java - 使用枚举的工厂
- javascript - setState 不设置状态
- azure - Jenkins 管道 - 在 ansible 和 Terraform 中引用 SSH Keys
- r - if_else 与have_labelled 列失败,因为错误的类
- javascript - 如何摆脱 v-on 处理程序中的错误:“TypeError:_vm.myFcn 不是函数”?
- javascript - 当我从下拉按钮中选择一个值时,其他值也会出现
- sas - SAS 中的 SUM() 来自同一个表 where 语句
- reactjs - NextJS getStaticProps 在开发重建时未更新
- ios - 如何在 Swift 本机代码中从 Flutter 调用参数?
- antlr - antlr4:访问者中的条件代码生成处理