首页 > 解决方案 > 如果特征数量增加,使用 one-hot 编码后提高准确性

问题描述

我最初是通过合并所有数据文件来解决 Telstra 网络中断问题。我得到了 480 多列,之后我完成了一次热编码,我的列变成了大约 1568。现在准确性不好。如何减少列并提高准确性?我已经申请了 PCA。

标签: pythonmachine-learningrandom-forest

解决方案


由于问题中没有足够的信息;我会挖掘可用的东西。有这么多列;数据变得稀疏。尝试在分类器中使用 L1 正则化


推荐阅读