首页 > 解决方案 > 计算每个日期和每个日期和类别的观察结果

问题描述

我需要解释熊猫的一种行为。假设这个数据框:

index;day;id;value
0;2020-01-03;1;14
1;2020-01-03;1;2
2;2020-01-03;2;5
3;2020-01-05;1;7
4;2020-01-05;1;9

当我想计算每天的观察次数和 id 时,我可以简单地做:

df["frequency_per_id"] = df(["id", "day"])["id"].transform("count")

但是当我想使用相同的公式计算每天的观察次数时:

df["frequency"] = df(["day"])["day"].transform("count")

我有一个错误<ipython-input-16-3a624d98b3b5>:1: SettingWithCopyWarning: A value is trying to be set on a copy of a slice from a DataFrame. Try using .loc[row_indexer,col_indexer] = value instead

你能解释一下为什么吗?我做同样的过程?非常感谢

标签: pythonpandasdate

解决方案


这是一个警告,而不是错误。我认为代码会完成你想要它做的事情。

这是一个非常常见的错误,谷歌搜索“SettingWithCopyWarning”返回数百篇文章和 StackOverflow 帖子


推荐阅读