python-3.x - 熊猫时间序列统计一个事件直到特定日期
问题描述
我是熊猫初学者,我正在使用来自https://www.kaggle.com/jordangoblet/atp-tour-20002016的网球数据,因此数据样本将是这样的
ATP Location Tournament Date Series Court Surface Round Best_of Winner Loser
1 Adelaide AO 3/01/2000 International Outdoor Hard 1st 3 Dosedel S. Ljubicic I.
1 Adelaide AO 3/01/2000 International Outdoor Hard 1st 3 Enqvist T. Clement A
屏幕截图 ,我正在尝试生成以下功能:
到目前为止,他们互相打了多少场比赛
到目前为止,每个球员都赢了多少场比赛
ETC
我尝试了基本的 groupbys 和重新采样,但无法达到所需的解决方案
解决方案
尝试根据事件的日期变量对数据框进行切片。然后您可以groupby
在辅助列上使用该功能。获取辅助列:
df['aux'] = df.apply(lambda x: '_'.join(sorted([x['Winner'], x['Loser']])), axis = 1)
分组后,您可以使用这些组来计算它们的任何类型的统计信息(如您提到的那些)。
如果您想获得整个历史的累积统计信息,您可以cumsum
在组上使用和类似的功能(如果您确保数据是根据事件时间戳排序的)。
如果还有什么不清楚的地方或者你被卡住了,请告诉我。
推荐阅读
- c# - 为什么按下按钮时我的方法没有全部运行?
- python - wordpress 可以用作 python bot 的前端吗?
- javascript - Node.js 在接收 SIGTERM 时的默认行为是什么?
- python - hub.get_expected_image_size 生成错误
- python - 销毁按钮 Tkinter 的问题,NameError
- javascript - calculating max - min within for loop
- javascript - 如何在 React 的 onLoad 中放置多个 If 语句
- json - Ansible:如何在 json_query 中使用一些分隔符拆分 json 数据
- c++ - 如何在 C++ 中准确地显示、存储和使用精确到一定小数位数的数据?
- php - 创建函数以显示单个产品的图像或占位符图像