python - 有没有一种简单的方法可以计算 Pandas value_counts Series 的平均值和标准差?
问题描述
为了测试(大)样本之间是否发生统计差异,我想从 value_counts 系列计算平均值和 sd:
在 [0] 中:counts.value_counts()
0 783
1 1128
2 744
3 366
4 119
5 38
6 10
7 3
我知道通过做类似的事情来计算平均值并不难
total = 0
for idx, val in counts.value_counts().iteritems():
total = total + idx*val
m = total/sum(sum(counts.value_counts()))
我在问是否有更短的方法来做到这一点。
而且我还问如何计算来自 counts.value_counts() 输出的标准偏差。
解决方案
你实际上可以做到这些。
counts.value_counts().mean()
counts.value_counts().median()
counts.value_counts().mode()
counts.value_counts().std()
推荐阅读
- c - 获得最有价值的路径
- postgresql - 如何在 Postgres 中索引表以加快 ORDER BY
- angular - matSort 不适用于 cdk-virtual-scroll-viewport
- javascript - 如何仅覆盖某些元素的 javascript 点击事件?
- c++ - 哪种数据结构更适合 - 堆或排序数组?
- spring-boot - 使用 Java 和 Spring Boot 发送电子邮件
- asp.net - 上传图片时出现 FileNotFoundException
- nsis - 在 Windows 上从源代码构建 NSIS(VS2012)
- java - 如何使点之间的速度相同?使用 lerp
- sms - WAP PUSH 通过 SMPP