首页 > 解决方案 > 具有重置索引的熊猫中 groupby 的时间复杂度

问题描述

我正在通过 groupby 对象运行一个循环。

d2_groupby = data.groupby(['A','B','C'])
def func(pattern):
    return #some indices of pattern dataframe

#first loop
for key,pattern in d2_groupby:
    func(pattern)
#second loop
for key,pattern in d2_groupby:
    func(pattern.reset_index(drop=True)

在上述两个循环中,为什​​么第二个循环比第一个循环快得多?第二个循环要快约 30 倍。如果我想使用第一种类型的循环,那么编写它的最佳方式是什么。提前致谢。

标签: pythonpandas-groupby

解决方案


推荐阅读