python - 如果特征数量增加,使用 one-hot 编码后提高准确性
问题描述
我最初是通过合并所有数据文件来解决 Telstra 网络中断问题。我得到了 480 多列,之后我完成了一次热编码,我的列变成了大约 1568。现在准确性不好。如何减少列并提高准确性?我已经申请了 PCA。
解决方案
由于问题中没有足够的信息;我会挖掘可用的东西。有这么多列;数据变得稀疏。尝试在分类器中使用 L1 正则化
推荐阅读
- sql - SQL Server 游标循环遍历列
- angularjs - 分页时Angularjs选择所有复选框不会持续存在
- android - 如何在画布上平移和旋转位图?
- r - R:如何将单个元素的多个列表连接到一个元素的单个列表中
- asp.net - 无法在 TFS 上构建具有 Angular 6.1.0 的 .NET 核心 SPA
- python - Django Rest Framework - 嵌套序列化不起作用
- php - 如何在没有插件的情况下使用 ajax 在 WordPress 中提交数据库中的自定义表单数据?
- c++ - Boost Circular Buffer push_back 在前面插入数据
- node.js - 使用 NODE 和 Express 创建后发送 html 文件
- amazon-web-services - 从 lmabda 以有限的访问权限在 ec2 中运行 php 文件