首页 > 解决方案 > 计算数据框列中间隔的标准偏差

问题描述

我想计算非滚动间隔的标准偏差。

我有一个这样的df:

value std year
  3   nan 2001
  2   nan 2001
  4   nan 2001
 19   nan 2002
 23   nan 2002
 34   nan 2002

等等。我只想计算每年的标准偏差并将其保存在“std”中相应行的每个单元格中。我每年都有相同数量的数据,因此间隔的长度永远不会改变。

我已经尝试过:

df["std"] = df.groupby("year").std()

但由于右边给出了一个新的数据框,它计算每一列的标准值,这显然是行不通的。

非常感谢大家的支持!

标签: pythonpandasstatisticsstandard-deviation

解决方案


国际大学联盟:

通过transform()方法尝试:

df['std']=df.groupby("year")['value'].transform('std')

或者

如果要查找多列的标准差,则:

df[['std1','std2']]=df.groupby("year")[['column1','column2']].transform('std')

推荐阅读