r - 有没有办法在 Sparklyr 中应用“Smote”?
问题描述
我正在尝试使用 sparklyr 在 Spark 中构建随机森林模型。由于数据集高度不平衡,我尝试使用合成少数过采样技术(“Smote”),并通过提取到 R 环境的样本数据显着增加了召回值。
由于我的数据集体积巨大,将数据提取到 R 环境中效率不高。我必须实现我的模型并处理 Spark 中的不平衡数据。但是 Sparklyr 包中不存在“smote”技术。有没有办法处理 sparklyr 中的不平衡数据集?
解决方案
推荐阅读
- javascript - 如何让我的复制文本JS听不止一个按钮?
- .net-core - 在领域驱动设计中,您应该通过 AggregateRoot 添加/更新实体吗?
- python - 如何在 Python 中将 mysql 日期时间 yyyy-mm-dd 格式化为 dd-mm-yyyy?
- python-3.x - Python 请求拉取并不总是检索数据
- python - 简单地将 1 加到一个大数上不起作用?(Python 3.9)
- ios - 您的应用程序包签名中的权利与配置文件中包含的权利不匹配
- typescript - 在打字稿中,如何将泛型添加到您希望使用 .call 调用的函数中
- php - 如何在 Laravel 中使用 API 密钥对 google_client 进行身份验证?
- mysql - 许多列上的 Sql 不为空
- android - Firebase `first_open` 事件 ---> `previous_first_open_count` 参数逻辑