首页 > 解决方案 > 如何根据索引值操作数据集?

问题描述

我有这个数据集wind_modified。在此数据集中,列是位置,索引是日期。列中的值是风速。假设我想找到每个位置 1 月份的平均风速,我如何使用 groupby 或任何其他方法来找到平均值?是否可以不重置 INDEX?编辑 - [This][2] 是实际的数据集。我已将“Yr、Mo、Dy”三列合并为一列,即“DATE”并将其设为 INDEX。我通过使用导入数据集pd.read_fwf。而“DATE”的类型为 datetime64[ns]。

[2]:

标签: pythonpandasdataframedataset

解决方案


当然,如果想要所有年份的所有一月,首先过滤它们boolean indexing并添加mean

#if necessary convert index to DatetimeIndex
#df.index = pd.to_datetime(df.index)

df1 = df[df.index.month == 1].mean().to_frame().T

groupby或者,如果在过滤器使用DatetimeIndex.year和聚合后需要每年一月分别使用mean

df2 = df[df.index.month == 1]
df3 = df2.groupby(df2.index.year).mean()

推荐阅读