首页 > 解决方案 > 使用 pyspark 模块中的函数时峰度是否过高?

问题描述

使用 pyspark 模块中的峰度函数时pyspark.sql.functions.kurtosis(col),结果是否超过正态分布?IE。是否已经从峰度中减去 3 以产生 k-3?还是我们必须自己计算超出部分?

标签: pysparkpyspark-sqlkurtosis

解决方案


我可能是错的,但由于 pyspark 的峰度为负值,我假设它是过度峰度,它已经从计算中减去了 3。


推荐阅读