python - 如何根据索引值操作数据集?
问题描述
我有这个数据集wind_modified。在此数据集中,列是位置,索引是日期。列中的值是风速。假设我想找到每个位置 1 月份的平均风速,我如何使用 groupby 或任何其他方法来找到平均值?是否可以不重置 INDEX?编辑 - [This][2] 是实际的数据集。我已将“Yr、Mo、Dy”三列合并为一列,即“DATE”并将其设为 INDEX。我通过使用导入数据集pd.read_fwf
。而“DATE”的类型为 datetime64[ns]。
[2]:
解决方案
当然,如果想要所有年份的所有一月,首先过滤它们boolean indexing
并添加mean
:
#if necessary convert index to DatetimeIndex
#df.index = pd.to_datetime(df.index)
df1 = df[df.index.month == 1].mean().to_frame().T
groupby
或者,如果在过滤器使用DatetimeIndex.year
和聚合后需要每年一月分别使用mean
:
df2 = df[df.index.month == 1]
df3 = df2.groupby(df2.index.year).mean()
推荐阅读
- java - 仅在 Safari 浏览器上下载 Java 中的视频文件抛出套接字写入错误
- json - 如何映射嵌套值以展平复杂的 json 数据结构 - Groovy
- python - Pyplot: Cmap(index) -> 颜色函数
- java - 如何处理错误
- django - django prefetch_related & Prefetch 嵌套
- sql-server - 如何更改 SSRS 中的部署凭据?
- java - 使用 http put 将值从 Angular 5 传递到 Java REST API,第 0:-1 行在输入处没有可行的替代方案
- wordpress - wordpress 简码包装
- java - Java JSONArray 对象返回 HTML 格式?
- ruby - Ruby 许多 HTTP 请求