首页 > 解决方案 > Python将数据框分成块

问题描述

我有 1 列 df 37365 行。我需要将它分成如下块:

df[0:2499]
df[2500:4999]
df[5000:7499]
...
df[32500:34999]
df[35000:37364]

想法是在如下循环中使用它(process_operation 不适用于大于 2500 行的 dfs)

while chunk <len(df):
    process_operation(df[lower:upper])

编辑:我将有不同的数据框作为输入。其中一些将小于 2500。捕获这些的最佳方法是什么?

Ej: df[0:1234] because 1234<2500

标签: pythonpandas

解决方案


这里的range功能就足够了:

for start in range(0, len(df), 2500):
    process_operation(df[start:start+2500])

推荐阅读