python - 访问 dd/mm/yy 来计算每年的总销售额?
问题描述
编辑:重新构建整个问题以使其更有意义(我认为?)
这是我要分析的数据框(或尽可能接近)。
Customer_ID = [1,2,3,4,5,6,7]
Sales_Info = [11,22,33,44,55,66,77]
begin_date = '2019-10-16'
df = pd.DataFrame({'Customer_ID':Customer_ID,'Sales_Info':units,'Purchase_Date':pd.date_range(begin_date, periods=len(units))})
print (df.head(10))
或者,这里是它的截图:[在此处输入图像描述][1] [1]:https://i.stack.imgur.com/1lYOt.png
我正在尝试在每个会计年度添加所有 Sales_Info。
显然,数据集的值比这多得多,但它是我能创建的最好的例子。到目前为止,我的编码知识可能仅限于BASIC,但我正在努力学习并希望得到任何帮助。
我已经尝试了以下一些示例,但我正在努力让任何结果输出正确,但我感谢每个人都试图帮助我并提前谢谢你。
解决方案
不确定您是如何使用您的数据以及它的格式如何,但一个非常简单的方法来总结一年的所有 sales_info 看起来像这样:
data = [{"id": 1 "date": "11/12/2020", "Sales_info": 2}, ...]
yearly_sum = {}
for datum in data:
year = datum["date"].split("/")[-1]
if year in yearly_sum.keys():
yearly_sum[year] += datum["Sales_info"]
else:
yearly_sum[year] = datum["Sales_info"]
本质上,检查它属于哪一年的每个条目,添加到 year->salesinfo 字典。请注意,代码未经测试,因此可能无法正常工作。
推荐阅读
- python - tensorflow TFRecordWriter 杀内核
- cloud - 具有身份的 Google Flex 应用网站
- python - 使用 Numpy 将 DataFrame 拆分为数组
- algorithm - 生成对称排列
- python - 加载泡菜时,出现导入错误,“没有名为 sip 的模块”
- swagger - nswag 生成破坏 URL 的代理
- java - setFocusTraversalKeysEnabled() 有什么用?
- android - 将参数传递给 SQLite 查询
- solr - 如何配置 solr 以确保单词位置
- python - TensorFlow 中的类型转换错误