首页 > 解决方案 > 访问 dd/mm/yy 来计算每年的总销售额?

问题描述

编辑:重新构建整个问题以使其更有意义(我认为?)

这是我要分析的数据框(或尽可能接近)。

Customer_ID = [1,2,3,4,5,6,7]
Sales_Info = [11,22,33,44,55,66,77]
begin_date = '2019-10-16'
df = pd.DataFrame({'Customer_ID':Customer_ID,'Sales_Info':units,'Purchase_Date':pd.date_range(begin_date, periods=len(units))})
print (df.head(10))

或者,这里是它的截图:[在此处输入图像描述][1] [1]:https://i.stack.imgur.com/1lYOt.png

我正在尝试在每个会计年度添加所有 Sales_Info。

显然,数据集的值比这多得多,但它是我能创建的最好的例子。到目前为止,我的编码知识可能仅限于BASIC,但我正在努力学习并希望得到任何帮助。

我已经尝试了以下一些示例,但我正在努力让任何结果输出正确,但我感谢每个人都试图帮助我并提前谢谢你。

标签: pythonpandasjupyter-notebookanalysis

解决方案


不确定您是如何使用您的数据以及它的格式如何,但一个非常简单的方法来总结一年的所有 sales_info 看起来像这样:

data = [{"id": 1 "date": "11/12/2020", "Sales_info": 2}, ...]
yearly_sum = {}
for datum in data:
    year = datum["date"].split("/")[-1]
    if year in yearly_sum.keys():
         yearly_sum[year] += datum["Sales_info"]
    else:
         yearly_sum[year] = datum["Sales_info"]

本质上,检查它属于哪一年的每个条目,添加到 year->salesinfo 字典。请注意,代码未经测试,因此可能无法正常工作。


推荐阅读