首页 > 解决方案 > 熊猫 groupby 只返回什么?

问题描述

我注意到在我的一些代码中,我对同一个 groupby 调用执行了不同的操作。所以我只打了一个电话:

c = df.groupby("SP")

并对“DataFrameGroupBy”对象运行不同的操作,例如:

c["SP"].cumsum()

还有其他几个,其中大多数是 cumsum,transform 类型,因此预期的索引相同。

到目前为止一切都很好,这在一定程度上加快了脚本的速度,但我注意到在创建 groupby 对象 (c) 之后,我偶尔会向原始 df 添加属性。此属性用于 groupby 操作。它似乎工作得很好。

但是,当某些行从 df 中删除时,c 上的聚合操作仍在旧 df 上完成所有行。

那么什么是 DataFrameGroubBy?它只是一个指向索引的指针吗?或者它是否制作了 DataFrame 的一些副本。从上面解释的行为看来,当您更改原始 DataFrame 中的行数时,会生成一个副本。

标签: pythonpandaspandas-groupby

解决方案


推荐阅读