python - 如何重新索引 pandas DataFrame,同时根据新索引对其进行重新采样并聚合其数据?
问题描述
1) 我在 pandas DataFrame 中有以下 1 分钟频率数据:
0 | 打开 | 高的 | 低的 | 关 | 体积 |
---|---|---|---|---|---|
2010-10-19 06:31:00 | 58.75 | 58.81 | 58.58 | 58.59 | 228125 |
2010-10-19 06:32:00 | 58.59 | 58.68 | 58.55 | 58.57 | 153303 |
2010-10-19 06:33:00 | 58.57 | 58.6 | 58.5 | 58.52 | 115647 |
2010-10-19 06:34:00 | 58.52 | 58.58 | 58.48 | 58.58 | 63577 |
2010-10-19 06:35:00 | 58.57 | 58.59 | 58.51 | 58.53 | 111770 |
2)我还有以下索引数组:
[2010-10-19 06:32:00, 2010-10-19 06:35:00]
3)我想根据索引数组重新索引数据帧,这样新的数据帧将只有索引数组的 2 行,同时设法重新采样它,以便新数据帧的第一行的高位是较高的原始数据帧前 2 行的高点,新数据帧第二行的低点是原始数据帧中 3 个低点中的较低者,依此类推。
通常,人们会通过 .resample() 和 .agg() 聚合数据,但前提是您已经拥有了所需状态的数据框。我不能以这样的方式使用 reindex() ,以至于我可以用 .resample() 跟进它并完成此操作。
我想我正在寻找一种方法来一次重新索引和重新采样。我怎样才能最好地做到这一点?
解决方案
使用特定日期从pandas Dataframe 重新采样中调整答案
from datetime import datetime
import numpy as np
import pandas as pd
df = pd.DataFrame(
data={c: np.random.rand(5) for c in ['o', 'h', 'l', 'c', 'v']},
index=pd.date_range(datetime(2020, 10, 19, 6, 31), datetime(2020, 10, 19, 6, 35), freq='T')
)
print(df)
o h l c v
2020-10-19 06:31:00 0.868832 0.011599 0.614113 0.920998 0.237791
2020-10-19 06:32:00 0.909751 0.277570 0.820222 0.493289 0.941469
2020-10-19 06:33:00 0.998590 0.667477 0.108915 0.551331 0.081069
2020-10-19 06:34:00 0.160800 0.179726 0.987618 0.351980 0.253893
2020-10-19 06:35:00 0.553217 0.873212 0.291289 0.235526 0.525988
sample_index = pd.DatetimeIndex([datetime(2020, 10, 19, 6, 32), datetime(2020, 10, 19, 6, 35)])
agg = {'o': 'first', 'h': 'max', 'l': 'min', 'c': 'last', 'v': 'sum'}
ohlcv = df.groupby(sample_index[sample_index.searchsorted(df.index)]).agg(agg)
print(ohlcv)
o h l c v
2020-10-19 06:32:00 0.868832 0.277570 0.614113 0.493289 1.179259
2020-10-19 06:35:00 0.998590 0.873212 0.108915 0.235526 0.860951
推荐阅读
- xamarin.ios - 尝试转到上一个情节提要时出现 NullReferenceException
- roslyn - 在 Roslyn Analyzer 中获取元组类型
- ruby-on-rails - 如何在rails中的CSV字符串中添加新列
- c++ - 如何提示用户重新循环整个程序?
- c# - 从其他类以编程方式访问 UWP 子元素
- python-3.x - Spyder 不会在 cmd 中启动
- c# - 如何以编程方式找到 Nuget 恢复的 DLL?
- firebase - 反应原生云功能日志为空
- c++ - C++ - 如何使用 shared_ptr 替换 T**
- java - 无法解析方法 append(int)