python - Python Pandas - 基于多列标准的 3D 数据帧 cumsum 直到达到值
问题描述
我在 python 中获取 3D 数据帧的累积总和时遇到了一些困难。
我创建的示例数据框是:
import numpy as np
import pandas as pd
arr=np.array([[[23, 10],
[ 24, 5],
[ 28, 8],
[ 30, 11],
[ 31, 1]],
[[20, 11],
[21, 3],
[22, 5],
[29, 15],
[30, 10]],
[[22, 26],
[23, 29],
[25, 32],
[33, 10],
[34, 15]]])
names = ['x', 'y', 'z']
index = pd.MultiIndex.from_product([range(s)for s in arr.shape], names=names)
df = pd.DataFrame({'Day': arr.flatten()}, index=index)['Day']
df = df.unstack(level='z')
df.columns = ['Price', 'Qty']
df.index.names = ['DATE', 'i']
在指定的日期范围内,如果价格低于某个值 (x),我想找到商品数量的总和。但是当总和超过某个数字(y)时,我会停止,无论其他商店或以后的日期是否还有满足最低要求。价格标准。我会先从最早的日期开始总结,在每个日期,从最低的价格开始总结。然后我会找到直到停止点的加权平均价格。
在上面的数据框中,假设我的标准是(1)日期 0 和 1,(2)价格等于或低于 25,(3)当数量总和首次超过 20 时停止。在这种情况下,相关数据是价格 23和日期 0 中的 24,日期 1 中的价格 20。这是因为日期 0 中的价格 23 和 24 的数量之和为 15,因此小于 20,但加上日期 1 中的价格 20 的数量,cumsum 变为 26因此该过程停止。因此,加权平均值为 (23*10)+(24*5)+(20*5) / 20
我目前的方法太麻烦了,使用while循环遍历时间轴,并为每个日期使用另一个while循环,这样如果价格比我的标准便宜,我会将数量和价格加权数量添加到跟踪总和中. 当跟踪总和大于指定值时,我将停止该过程并计算加权平均值。然后我也可以返回进程停止的位置。
希望获得一些关于如何以更有效的方式实现这一目标的建议?
解决方案
这是一个执行此操作的自定义函数,只需像示例中一样插入您的变量。
def weighted_average(df, dates, price_limit, stop_sum):
# filter multiindex for your dates, plus price_limits
tmp = df.loc[dates].loc[df['Price'] <= price_limit]
# find index of halting cumsum condition, take tmp until there
tmp = tmp.loc[:(tmp['Qty'].cumsum() > stop_sum).idxmax()]
# update last value
tmp.iat[-1, df.columns.get_loc('Qty')] -= tmp['Qty']sum() - stop_sum
# return the weighted average
return tmp.product(axis=1).sum() / stop_sum
dates = [0, 1]
price_limit = 25
stop_sum = 20
weighted_average(df, dates, price_limit, stop_sum)
> 22.5
过滤器 ( ) 的替代方案(对于大型数据集可能性能更高tmp = df.loc[dates].loc[df['Price'] <= price_limit]
)是
tmp = df[(df.index.get_level_values(0).isin(dates)) & (df['Price'] <= price_limit)]
推荐阅读
- java - 如何修复空堆栈异常?
- salesforce - Salesforce 静态资源限制 250MB
- python - Pandas 根据另一列中的条件选择前 10 个值
- google-sheets-formula - Google 表格中的 Query() 函数会产生杂散值:为什么,我该如何解决?
- google-cloud-functions - 带有图像存储位置的 Firebase Functions 电子邮件
- java - 获取列表中访问最少的元素(Java 8)
- javascript - 将文件上传到 ASP.NET Core。数组始终为空
- javascript - 如何使用猫鼬对两个元素进行分组?
- java - 将 Pattern#astMatchPredicate 与 Stream#takeWhile 一起应用
- html - 显示不同评论的下拉菜单