python - Pandas/Python 如何为特定变量值创建平均值?
问题描述
我是使用 Pandas/python 的新手,我想知道,当我有一个数据集时,我如何从一个变量、数量、另一个变量的每个值、价格、如果变量小时在某些特定值之间创建平均值,让我们说 1 到 10。为了更好地理解我所拥有的内容如下:
我想要获得的是以下绿色的价格和数量列;这是 1<=hour<=10 时每个价格的平均成交量。
我将衷心感谢您的帮助!
提前致谢!
解决方案
快速提示:如果您发布问题,请提供有关如何创建数据框的启动代码(而不是发布屏幕截图),因为它使帮助您的人更容易。
第 1 步:使用掩码过滤数据框
第 2 步:使用掩码创建新的数据框
第三步:使用 groupby 对象
import pandas as pd
# sample dataframe
df = pd.DataFrame({
'Hour': [1, 1, 1, 4, 4, 4, 16, 16, 16],
'Price': [-3000, -262, 150, -3000, -262, 150, -3000, -262, 150],
'Volume': [8133, 28287, 19289, 20242, 19428, 28322, 18147, 17234, 12133],
})
print('Raw dataframe:')
print(df, '\n')
# first create a mask that filters the data you want
mask_hour_1to10 = df['Hour'].between(1, 10)
# second create a new dataframe with the mask
df_filtered = df.loc[mask_hour_1to10]
print('Filtered dataframe:')
print(df_filtered, '\n')
# third, use a groupby object on price, to calculate average of volume
df_groupby_mean = df_filtered.groupby('Price')['Volume'].mean()
print('Groupby Object:')
print(df_groupby_mean)
推荐阅读
- amazon-web-services - 将数据卸载到 S3 时分配唯一的文件名
- javascript - React SlideToggle 插件通过道具扩展
- c# - 在 C# 中获取无限循环 - 计算器应用程序初学者
- mongodb - MongoDB-获取精确的数组元素,不包括其他元素
- xamarin - Xamarin.Forms:MvxBind MvxAsyncCommand 到 MvxListView ItemSelected
- python-3.x - 如何仅迭代列表的最后一个元素?
- javascript - 如何在同一页面上有两个导航栏
- r - 根据 r 中的特定标准重新编码数值变量
- node.js - 无法获得 Apple Pay 付款会话
- windows - 在 Spyder 的 IPython 控制台中启动内核时出现 PermissionError