python - Python pandas 在时间间隔内查找数据
问题描述
我正在使用犯罪统计数据(在数据框中),我试图找出大多数犯罪发生在上午 12 点至上午 8 点、上午 8 点至下午 4 点和下午 4 点至下午 12 点之间的时间。我已经将该列转换为 DateTime。我使用的代码是:
#first attempt
df_15['FIRST_OCCURRENCE_DATE']=pd.date_range('01/01/2015',periods=10000,freq='H')
df_15[(df_15['FIRST_OCCURrENCE_DATE'] > '2015-1-1 00:00:00') & (df_15['FIRST_OCCURRENCE_DATE'] <= '2015-12-31 08:00:00')]
#second attempt
df_15 = df_15.set_index(df_15['FIRST_OCCURRENCE_DATE'])
df_15.loc['2015-01-01 00:00:00':'2015-12-31 00:00:00']
#third attempt
date_rng = pd.date_range(start='00:00:00', end='08:00:00',freq='H')
date_rng1 = pd.DataFrame(date_rng)
date_rng1.head(30)
#fourth attempt
df_15.FIRST_OCCURRENCE_DATE.dt.hour
ts = pd.to_datetime('12/31/2015 08:00:00')
df_15.loc[df_15.FIRST_OCCURRENCE_DATE <= ts,:].head()
我得到的结果是 08:00:00 之外的时间条目。
PS。所有数据均来自同一年
解决方案
看起来你可以做一些算术和计数:
(df_15['FIRST_OCCURrENCE_DATE'].dt.hour // 8).value_counts()
有很多方法可以解决这个问题,但这可能是最简单的。从每个日期中提取一天中的小时,找到它属于哪个时间段。除以 8 得到 0 (12AM-8AM)、1 (8AM-4PM) 或 2 (4PM-12AM),然后只计算这些出现次数。
推荐阅读
- android - Android WidgetProvider (Kotlin) 和自定义活动广播
- android - 如何从 Koin lib 修复“找不到类型‘上下文’的兼容定义”?
- sql - 创建所有可能的文本组合
- python-3.x - 将字符串传递给包含特定字符的“字母表”以进行词法分析
- wordpress - 更改 divi 主题的 POST 设计
- python-3.x - robotsFramework-appium 是否支持 Python3+?
- java - JOSEException:无法创建 AES/GCM/NoPadding 密码:非法密钥大小
- javascript - Express.js 与 Node.js,多个客户端
- laravel - Laravel 资源语法
- javascript - 无法使用 axios 设置状态