python - 如何处理数据集中的匿名变量以获得更好的预测
问题描述
我有数据集,其中有 4 个匿名变量,如下所示,目标变量也是匿名的:
有人可以告诉我如何处理机器学习中的匿名特征,从这个匿名变量中进行特征工程的最佳方法是什么,我如何可以从这个特征中改进我的预测
解决方案
您应该执行多个步骤:
1-缩放数字特征并对分类特征进行一次性编码(您还可以使用出现次数对分类变量进行编码=用其计数替换每个值)
2-研究目标与其他变量之间的相关性
3- 使用不同的图更好地了解您的数据
4- 在建模时使用变量选择方法
推荐阅读
- java - 使用 JAVA 修改 LDAP 中的用户属性
- owasp - OWASP CRS MoD 安全误报 - 规则 942150 “@contains”
- python - 使用 selenium 的点击音频挑战 recaptcha v2 的问题
- javascript - 角滑动网格 | 如何动态禁用selectableOverride的checkboxSelector的行选择
- reactjs - 我的 firebase 上有大量阅读资料,如何冻结我的 React Firebase 应用程序的对象?
- drake - Drake 中输入和输出端口之间的仿射关系
- python - 如何从python中的另一个模块获取变量名
- flutter - 状态栏被我在 Flutter 中的应用程序屏幕重叠
- javascript - javascript 文件中的 Django ManifestStaticFilesStorage 和导入
- reactjs - 带有 Gatsby 的 Redux - 无法识别包装的提供程序