首页 > 解决方案 > 有没有一种简单的方法可以计算 Pandas value_counts Series 的平均值和标准差?

问题描述

为了测试(大)样本之间是否发生统计差异,我想从 value_counts 系列计算平均值和 sd:

在 [0] 中:counts.value_counts()

0    783 
1   1128  
2    744  
3    366  
4    119   
5     38   
6     10    
7      3

我知道通过做类似的事情来计算平均值并不难

total = 0
for idx, val in counts.value_counts().iteritems():
    total = total + idx*val
m = total/sum(sum(counts.value_counts()))

我在问是否有更短的方法来做到这一点。

而且我还问如何计算来自 counts.value_counts() 输出的标准偏差。

标签: pythonpandasstatistics

解决方案


你实际上可以做到这些。

counts.value_counts().mean()
counts.value_counts().median()
counts.value_counts().mode()
counts.value_counts().std()

推荐阅读