首页 > 解决方案 > 对结果进行平均计算的列条件计数

问题描述

我有一个具有这种结构的数据框

v1|v2|v3|
 2| 3| 4|
  | 5| 4|
 5| 1| 4|

我想计算每列的所有 4 和 5,然后除以该列的所有条目数。之后我想计算所有这些值的平均值。在这种情况下(1/2+1/3+3/3)/3=0.611

sum over x(Count Vx if 4 or 5)/Count Vx(without missings)/x

到目前为止我尝试过的是:) df[df > 4 and df > 5].count(但我已经在这里遇到了很多错误。谁能走上正轨?

标签: pythonpandas

解决方案


你可以试试:

df.isin([4,5]).sum().div(df.count()).mean()

输出:

0.611111111111111

推荐阅读