首页 > 解决方案 > 有没有办法在 Sparklyr 中应用“Smote”?

问题描述

我正在尝试使用 sparklyr 在 Spark 中构建随机森林模型。由于数据集高度不平衡,我尝试使用合成少数过采样技术(“Smote”),并通过提取到 R 环境的样本数据显着增加了召回值。

由于我的数据集体积巨大,将数据提取到 R 环境中效率不高。我必须实现我的模型并处理 Spark 中的不平衡数据。但是 Sparklyr 包中不存在“smote”技术。有没有办法处理 sparklyr 中的不平衡数据集?

标签: rapache-sparksparklyr

解决方案


推荐阅读