首页 > 技术文章 > 二值变量间的相关性分析补充

dan-baishucaizi 原文

前述知识见二值变量间的相关性分析

  dc系数,这里作者是用自己名字命名,也是区分度相关系数的一个缩写。

  关于dc系数的表达式我们可以使用如下的表达式,该表达式要比第一个表达式更优。因为区分度d实际上是一个平方项,开发之后的sqrt(d)能更好的刻画区分度,所以dc系数为:

    

即我们用新的区分度sqrt(d)来代替之前的区分度d。

  同样的数据运行结果为:

  

清澈的爱,只为中国

推荐阅读