python - Python Pandas - 获取特定月份的第一天和最后一天的行
问题描述
我的数据集df
如下所示:
Date Value
...
2012-07-31 61.9443
2012-07-30 62.1551
2012-07-27 62.3328
... ...
2011-10-04 48.3923
2011-10-03 48.5939
2011-09-30 50.0327
2011-09-29 51.8350
2011-09-28 50.5555
2011-09-27 51.8470
2011-09-26 49.6350
... ...
2011-08-03 61.3948
2011-08-02 61.5476
2011-08-01 64.1407
2011-07-29 65.0364
2011-07-28 65.7065
2011-07-27 66.3463
2011-07-26 67.1508
2011-07-25 67.5577
... ...
2010-10-05 57.3674
2010-10-04 56.3687
2010-10-01 57.6022
2010-09-30 58.0993
2010-09-29 57.9934
下面是两列的数据类型:
Type Column Name Example Value
-----------------------------------------------------------------
datetime64[ns] Date 2020-06-19 00:00:00
float64 Value 108.82
我希望其中的一个子集df
仅包含选择了 10 月的第一个条目和7 月的最后一个条目的行:
Date Value
...
2012-07-31 61.9443
2011-10-03 48.5939
2011-07-29 65.0364
2010-10-01 57.6022
知道怎么做吗?
解决方案
您可以按日期排序,以便知道它们是按时间顺序排列的。之后创建两个数据框,一个月为 7 并获取组的最后一条记录,一个月为 10 的数据框获取该组的第一条记录。
然后你可以连接它们。
df['Date'] = pd.to_datetime(df['Date'])
df = df.sort_values(by='Date')
j = df[df['Date'].dt.month == 7].groupby([df.Date.dt.year, df.Date.dt.month]).last()
o = df[df['Date'].dt.month == 10].groupby([df.Date.dt.year, df.Date.dt.month]).first()
pd.concat([j,o]).reset_index(drop=True)
输出
Date Value
0 2011-07-29 65.0364
1 2012-07-31 61.9443
2 2010-10-01 57.6022
3 2011-10-03 48.5939
推荐阅读
- python - 如何在没有 pip 的情况下升级/安装软件包
- debugging - Eclipse C++:执行 MI 命令失败:-exec-run
- wordpress - 更新类别中所有帖子中为空的 Post_Content - Wordpress
- c# - 如何通过 Unity (C#) 使用 Ruby on Rails 用户控制器注册新用户?
- java - JTable 和 JButton 设计区别
- ios - 快速删除我的文本文件中的单元格文本行
- c# - 从 Active Directory 组中获取所有用户
- javascript - 在 setInterval() 中更新参数 - 参数不更新
- angular - System.config 未定义
- excel - 双击会出现错误数据