python - 是否应该将相同的最小值和最大值应用于 DataFrame 的训练和预测?
问题描述
我正在申请sklearn.preprocessing.MinMaxScaler()
DataFrame 并使用 DataFrame 进行机器学习。训练后,我有一个单独的代码和 DataFrame 来进行预测。在预测代码中,我MinMaxScaler()
对要用于预测的 DataFrame 进行了操作。Training DataFrame 和 Prediction DataFrame 将具有不同的 Min 和 Max 值。我的问题是训练数据帧和预测数据帧是否应该使用相同的最小值和最大值以获得准确的预测?
解决方案
是的,您应该MinMaxScaler()
在火车和测试中使用相同的。
说明:假设您的训练数据集具有 min=10 和 max=20 的一些特征,并且您的测试数据集具有 min=1 和 max=10 的特征。如果在测试中训练单独的缩放器,则测试数据值将低于训练数据集。
推荐阅读
- python - Django 在除主页面之外的所有页面上都没有找到静态
- laravel - 从 vue-tables-2 组件捕获请求的 ruote 规则无效
- javascript - 如何使用JS PHP AJAX确定分数和字母等级
- sql - 在 Rails 中执行 sql 查询时如何访问嵌套的哈希值?
- python - 如何使用 Python async/await 同时运行两个任务?
- javascript - 如何在`beforeunload`事件的刷新页面上向服务器发送请求?
- vimeo - Vimeo API - 获取哪个用户是主持人的所有频道?
- sql - 查询在企业版 postgres 中有效,但在社区版中无效
- react-native - WebStorm 使用 react-native-web 导入错误?
- java - 在 Apache Tomcat 中,是否可以有多个访问日志文件,由连接器过滤?