python - 在 PySpark 中,如何将直线拟合到每一行数据并将渐变附加到数据帧?
问题描述
我有一个看起来像这样的数据框:
uniqueKey | Month1 | Month2 | ... | MonthN
a | 1 | 2 | ... | 3
b | 3 | 4 | ... | 5
每行都是唯一的。我想为每一行拟合一条直线并将渐变值附加到数据帧的末尾。
我知道如何将SparkML
OLS 拟合到整个数据框,但是这个数据框很大,我想以分布式方式进行。
解决方案
推荐阅读
- python - SyntaxError:无效的语法,但遵循 WTF 文档,但仍然不接受
- html - 使用 flexbox 和 bootstrap 卡填充高度
- qt - Qt Installer 创建开始菜单快捷方式
- firebase - 用户注册时 Firestore 权限不一致
- c# - MySQL 服务器停止运行从 C# 应用程序发送的特定查询
- amazon-web-services - Athena 查询排队时间:什么影响它?
- mysql - 如何将变量值设置为零每一行
- c# - 在 linq 查询中返回集合时,用字符串数组替换整数数组
- javascript - 获取 React 中被点击元素的值
- node.js - 从主机在 docker 容器上运行命令