performance - 对于不平衡的大型数据集,R 中有哪些更快的 SMOTE 替代方案?
问题描述
我有一个包含 260,000 个观察值和 30 个 IV 的训练集,并且二元类不平衡为 1:6(是的,它确实会破坏模型的性能),但不能选择使用 SMOTE,因为它需要在我的笔记本电脑上花费这么多时间数据的。在计算速度和效率方面,有没有比 SMOTE 更好的选择?我想尝试一些比随机欠采样和类权重更有效的方法。很高兴听到在 R 中使用的任何建议!
解决方案
推荐阅读
- javascript - 按sharepoint 2013按组获取列表项
- api - 如何限制对 Google App Engine 的外部访问并仅允许 Apigee Edge?
- date - 日期的条件格式
- php - 除非清除 Cookie,否则登录页面会超时
- meteor - 启用汇总的 Meteor 1.9 构建中断
- javascript - Javascript,函数在其中更改变量值,但在其外部变量保持不变?
- acumatica - 在发布后的发票和备忘录上,我们启用了页眉和页脚的自定义字段,但在修改余额时更新错误值
- stripe-payments - 使用 Stripe Payments 的 3 级数据
- reactjs - 带有数组道具的自定义钩子正在无限循环
- viber - 对话开始事件的 Viber API 文档问题