首页 > 解决方案 > 按表达式丢失 Dask 组中的列

问题描述

我有一个这样的数据框:

                          EVENT_TYPE PRICE  TICKER
TIME            
2018-07-02 06:00:00.030691  TRADE   22.52   HPQ

我的分组如下:

g = dfs[dfs.EVENT_TYPE == 'TRADE'].groupby(['TICKER', pd.Grouper(freq="D")])
g.first().compute()

但是,输出仅作为按列分组:

TICKER  TIME
AAPL    2018-07-02
        2018-07-03
        2018-07-05
        2018-07-06

我无法使用 Pandas 或 Dask 用随机数据重现这一点。在其他类似的问题中,有人建议使用 reset_index,但是当我在输出上调用 reset_index 时,我收到了另一个异常(“计算数据中的列与提供的元数据中的列不匹配”,即使我没有为 group by 操作提供元数据),我不清楚问题是否源于我是否需要使用 group by 键作为索引,无论如何。

非常感谢您的任何帮助。

标签: daskdask-distributed

解决方案


推荐阅读