首页 > 解决方案 > 使用 pyspark 进行方差分析

问题描述

我在网上搜索无济于事,但是 pyspark 中是否有可以执行 ANOVA 和 Tukeys HSD 的函数或库?还是我必须从头开始编写代码?

标签: dataframeapache-sparkpysparkanovastatistical-test

解决方案


您可以将 SciPy 包用于 PySpark 中的 ANOVA,例如单向 ANOVA,以及用于PySpark 中 Tukey HSD 的 statsmodels 包


推荐阅读