首页 > 解决方案 > 当一列有值而另一列为空时的值百分比

问题描述

可能这是其他问题的重复,但我无法解决问题。

我有具有 100 个特征和 230 万行的事务数据。我想为每个列组合查找一列中存在的值的百分比和另一列中的 Null 值。

例子:

  A  B  C  D
  1  NA 2  3
  2  4  5  6
  NA 5  6  7
  8  2  NA NA
  9  8  7  6

所以输出应该是:

  When A has values B has Null 1/4=0.25 times
  When A has values C has Null 1/4=0.25 times

同样,对于所有其他列组合并为其创建一个数据框。

我尝试在 Python 中组合列函数,但没有给出预期的结果。

itertools.combinations(daf.columns, n)

标签: python-3.x

解决方案


您可以编写 2 个 for 循环来迭代各个列,然后进行比较。


推荐阅读