python - Dask:在 groupby 中使用 Grouper 后迭代组
问题描述
在 dask groupby 中使用 Grouper 后是否可以遍历每个组。我试过了
import dask.dataframe as dd
import pandas as pd
pdf = pd.DataFrame({'A':[1, 2, 3, 4, 5], 'B':['1985','1985','1990','1990','1990']})
pdf['B']=pd.to_datetime(pdf['B'], format="%Y")
ddf = dd.from_pandas(pdf, npartitions = 3)
groups = ddf.groupby(pd.Grouper(key='B', freq="Y"))
for group in ddf['B'].unique().compute():
print(groups.get_group(pd.Timestamp(group))['A'].mean().compute())
但是得到一个错误:
TypeError: object of type 'TimeGrouper' has no len()
这类似于问题iterate over GroupBy object in dask但使用 Grouper。
解决方案
推荐阅读
- python-2.7 - python 2.7.12 的 Numpy 错误
- amazon-web-services - AWS - 如何以编程方式获取账单月度预测
- icalendar - 第一次降临的规则
- amazon-web-services - AWS:ELB 运行状况失败或不适用于所有实例
- ios - 'React/RCTAnimationType.h' 文件未找到
- r - 大型矩阵上每行的皮尔逊系数
- terraform - 将 Terraform 生命周期 ignore_changes 应用于工作区中的所有资源
- r - 如何用另一个相同维度的data.table的值替换一个data.table中的某个值
- python - 无法使用 python 解码这个字符串
- javascript - React 中的导入/导出