python - 在python中将时间序列数据从一列重新采样为多列
问题描述
我正在尝试将以下数据集中的列“lang”重新采样为两列,告诉我们每个时期(比如说每周)中每个值(“zh”和“en”)的计数,假设数据集是熊猫数据框。有谁知道我该怎么做?我发现 .resample() 可能是一种出路,但我只能找到处理列内数据的示例。谢谢!
date lang
2019-05-01 07:59:42+00:00 zh
2019-05-04 07:57:53+00:00 en
2019-05-06 07:52:40+00:00 zh
2019-05-08 07:43:38+00:00 en
2019-05-10 07:40:40+00:00 zh
2019-05-13 07:37:25+00:00 zh
2019-05-16 07:31:55+00:00 zh
2019-05-18 07:15:53+00:00 en
解决方案
采用:
df.groupby([pd.Grouper(freq='W', key='date'), 'lang']).size().unstack(fill_value=0)
推荐阅读
- python - 如何在 selenium 的每个 POST 调用中从服务器获取更多数据?
- asynchronous - 一旦函数完成运行,从 Python 调用 Excel 函数并导入未知维度的输出
- amazon-kinesis - localstack Kinesis 不在 docker 中启动
- css - 如何从 Internet Explorer 中的打印页面中删除页眉和页脚
- java - 如何分隔数组开头的名称?
- java - 不可变类的存储区域
- php - PHP IF 语句要使用 Else If 还是另一个 IF 语句?
- python-3.x - 如何使用 python 运行管理命令提示符?
- dask - dask read_parquet 内存不足
- spring-boot - Spring Boot JPA find, filter