python - 如何汇总数据框中的条目?
问题描述
我有一个hello.csv
包含下载时间的 csv 文件,并且想计算每季度的下载量。下面的代码运行良好,但我成为 csv 文件每一行的季度和本季度的计数。我想总结一下,本季度的计数只出现一次。或者换句话说,我想删除重复项
df = pd.read_csv('hello.csv')
df['quarter'] = pd.PeriodIndex(df.time, freq='Q')
df['count'] = df.groupby('quarter')['quarter'].transform('count')
df = df[['quarter','count']]
12.130.14.jga 2016-08-06 23:14:47 34903 0001193125-16-644579
26955 12.130.14.jga 2016-08-16 01:39:04 1555218 0001193125-12-475878
26956 12.130.14.jga 2016-08-16 01:42:51 1605607 0001193125-14-323048
26957 12.130.14.jga 2016-08-18 22:56:56 1001039 0001001039-16-000468
26958 12.130.14.jga 2016-08-19 01:29:37 1447599 0001193125-15-376713
26959 12.130.14.jga 2016-08-22 13:09:57 1651308 0001047469-16-009959
26960 12.130.14.jga 2016-08-25 15:45:39 1271024 0001193125-11-314369
26965 12.130.14.jga 2016-09-01 19:14:42 1447669 0001157523-16-006477
26966 12.130.14.jga 2016-09-26 14:06:24 712034 0001193125-12-000769
26967 12.130.14.jga 2016-09-26 14:07:01 712034 0001193125-12-056675
26968 12.130.14.jga 2016-09-26 14:07:59 712034 0001193125-12-054758
这是我的 csv 文件的摘录,日期都来自 2016Q3,所以我想要输出“[2016Q3 11]”。但我变成了一个有 11 行相同的数据框
解决方案
推荐阅读
- spring - 使用spring boot默认杰克逊映射时日期时区发生变化
- html - 使用 inline-block 时 div 消失
- app-engine-ndb - 设置 NDB 模型对象的 is_saved 属性未按预期工作
- tortoisehg - 在 Windows 中使用 TortoiseHg 复制和重命名
- dns - 如何从 .onmicrosoft.com 域中删除两条 TXT 记录
- node.js - Nodejs错误:ENOENT:没有这样的文件或目录,stat
- javascript - 如何使用 regex-Javascript 检查字符串中是否存在“未定义”测试
- docker - Docker 复制或添加删除现有文件
- amazon-web-services - Presto SQL:TO_UNIXTIME
- java - 带有部分 json 反序列化的 Jackson 2 @JsonConstructor