python - 如何从 Dask 数据框中选择 n 个等距的行?
问题描述
我有许多镶木地板文件,其中所有块都太大而无法放入内存。我想将它们加载到一个 dask 数据框中,计算一些结果(cumsum),然后将 cumsum 显示为一个图。出于这个原因,我想从 cumsum 行中选择等距的数据子集(一些 k 行),然后绘制这个子集。我该怎么做?
解决方案
你可以试试:
slices = 10 # or whatever
slice_point = int(df.shape[0]/slices)
for i in range(slices):
current_sliced_df = df.loc[i*slice_point:(i+1)*slice_point]
对当前切片做任何你想做的事
推荐阅读
- awk - 无法在此脚本中将文件复制到 linux 中的用户
- excel - 脚本任务在 Visual Studio 中工作,但在部署包时不工作
- python - 如何将进程名称和进程附加到字典?
- r - 在 R -Cyprus 示例中计算到海岸线的距离
- c# - Mac C# 应用程序打开 Word 模板,将文本从应用程序表单/窗口 texboxes 插入到 .docx 文本字段并保存它们
- javascript - 如何根据javascript中的规则对字符串应用正则表达式?
- python - 如何将单元格从一个工作簿复制到具有其设置样式的另一个工作簿?
- database - 使用诸如 Git 之类的 VCS 来跟踪数据库内容(记录)更改?
- node.js - Mongoose.Model.findById() 返回 null
- spring - 分段文件上传 - 超出 maxFileSize