首页 > 解决方案 > 使用 Pandas 整理 Excel 工作表

问题描述

我有一个超过 40,000 行的 Excel 表。第一列是日期时间,每分钟都有一个值。

我想减少这个,让我每 15 分钟阅读一次。

我试过以下代码:

data = pd.read_excel('file.xlsx')
data = data.resample('15T', on='Datetime').sum()
data.to_excel('new_file.xlsx')

显然,这是每 15 分钟给我一次读数,但它(显然)是对每 15 分钟时间段的值求和。我不想要这个...我只想删除 0 和 15、15 和 29 等之间的值。

电子表格示例

有任何想法吗?

标签: pythonexcelpandas

解决方案


index = pd.date_range('1/1/2000', periods=9, freq='T')
series = pd.Series(range(9), index=index)

series.resample('3T').interpolate()

其中 interpolate 将让您猜测缺少 15 分钟数据项的位置

所以在你的例子中,它会是

data = pd.read_excel('file.xlsx')
data = data.resample('15T', on='Datetime').interpolate()
data.to_excel('new_file.xlsx')

推荐阅读