pandas - 在 DataFrame 建模中实现的 Scaling Feature
问题描述
我有 15 列的数据集,下面的场景 9 -列是分类用途,所以我将数据转换为一个热编码器
6 列是数字,6 - 3 列中有异常值,因为列值的范围不同,所以我选择 RobustScaler() 作为缩放功能,其他我选择标准标量。之后,我结合了所有数据框并应用了逻辑回归算法,即使我在没有缩放的情况下获得了很好的分数,我的模型也产生了非常低的分数。
任何人都可以帮助解决这个问题吗?
解决方案
请对数据框应用列标准化并查看输出。我想由于逻辑回归对异常值很敏感,你正面临问题
正确估算异常值,然后应用列标准化
推荐阅读
- javascript - 如何在ag-grid中默认对列进行排序?
- flutter - 如何在颤动中将容器堆叠在另一个容器内部或下方
- javascript - 如何访问数组中对象的名称属性
- c# - 当我们用字段调用替换静态方法调用时如何删除括号
- c# - 检查对象是否在我创建的列表中
- c# - 如何在 Swagger 中指定 400 响应返回字符串和 OK 响应返回 xlsx 文件的操作方法?
- jquery - 如何在 jquery ajax 中拆分 api 响应以作为一个响应的不同站点的测试和 prod 脚本
- c++ - Valgrind 和 ostream 运算符
- android - React-Navigation 添加到现有应用程序
- python - Python Pandas 基于另一个对应数据框合并两个数据框