首页 > 解决方案 > 在python中将时间序列数据从一列重新采样为多列

问题描述

我正在尝试将以下数据集中的列“lang”重新采样为两列,告诉我们每个时期(比如说每周)中每个值(“zh”和“en”)的计数,假设数据集是熊猫数据框。有谁知道我该怎么做?我发现 .resample() 可能是一种出路,但我只能找到处理列内数据的示例。谢谢!

    date    lang
2019-05-01 07:59:42+00:00   zh
2019-05-04 07:57:53+00:00   en
2019-05-06 07:52:40+00:00   zh
2019-05-08 07:43:38+00:00   en
2019-05-10 07:40:40+00:00   zh
2019-05-13 07:37:25+00:00   zh
2019-05-16 07:31:55+00:00   zh
2019-05-18 07:15:53+00:00   en

标签: pythonpandastime-series

解决方案


采用:

df.groupby([pd.Grouper(freq='W', key='date'), 'lang']).size().unstack(fill_value=0)

推荐阅读