首页 > 解决方案 > 对于不平衡的大型数据集,R 中有哪些更快的 SMOTE 替代方案?

问题描述

我有一个包含 260,000 个观察值和 30 个 IV 的训练集,并且二元类不平衡为 1:6(是的,它确实会破坏模型的性能),但不能选择使用 SMOTE,因为它需要在我的笔记本电脑上花费这么多时间数据的。在计算速度和效率方面,有没有比 SMOTE 更好的选择?我想尝试一些比随机欠采样和类权重更有效的方法。很高兴听到在 R 中使用的任何建议!

标签: performancesamplingimbalanced-data

解决方案


推荐阅读