dataframe - 使用 pyspark 进行方差分析
问题描述
我在网上搜索无济于事,但是 pyspark 中是否有可以执行 ANOVA 和 Tukeys HSD 的函数或库?还是我必须从头开始编写代码?
解决方案
您可以将 SciPy 包用于 PySpark 中的 ANOVA,例如单向 ANOVA,以及用于PySpark 中 Tukey HSD 的 statsmodels 包。
推荐阅读
- javascript - 使用 SAML 登录 Firebase 会解决什么问题?
- android - 启动画面对本机反应的负载有轻微的影响
- dockerfile - Docker:从 Dockerfile 创建容器后,我的上下文文件在哪里?
- python - 我的 tf.data 输入管道正在将图像转换为负片。我怎样才能阻止它?
- javascript - 如何在javascript中将二维点投影到二维轴上
- javascript - Material-UI - 类组件的 withWidth() 替代方案
- python - 设置轴范围移动图像
- c++ - 评估中缀表达式而不将其转换为后缀
- c# - 如何通过在实体框架中添加表来创建 DbSet 函数
- jquery - jQuery-Tabledit 在我编辑时抛出 parseerror "Unexpected end of JSON input"