首页 > 解决方案 > 如何处理数据集中的匿名变量以获得更好的预测

问题描述

我有数据集,其中有 4 个匿名变量,如下所示,目标变量也是匿名的:

在此处输入图像描述

有人可以告诉我如何处理机器学习中的匿名特征,从这个匿名变量中进行特征工程的最佳方法是什么,我如何可以从这个特征中改进我的预测

标签: pythonmachine-learningdata-science

解决方案


您应该执行多个步骤:

1-缩放数字特征并对分类特征进行一次性编码(您还可以使用出现次数对分类变量进行编码=用其计数替换每个值)

2-研究目标与其他变量之间的相关性

3- 使用不同的图更好地了解您的数据

4- 在建模时使用变量选择方法


推荐阅读