首页 > 解决方案 > 是否应该将相同的最小值和最大值应用于 DataFrame 的训练和预测?

问题描述

我正在申请sklearn.preprocessing.MinMaxScaler()DataFrame 并使用 DataFrame 进行机器学习。训练后,我有一个单独的代码和 DataFrame 来进行预测。在预测代码中,我MinMaxScaler()对要用于预测的 DataFrame 进行了操作。Training DataFrame 和 Prediction DataFrame 将具有不同的 Min 和 Max 值。我的问题是训练数据帧和预测数据帧是否应该使用相同的最小值和最大值以获得准确的预测?

标签: pythondataframetensorflowscikit-learnsklearn-pandas

解决方案


是的,您应该MinMaxScaler()在火车和测试中使用相同的。

说明:假设您的训练数据集具有 min=10 和 max=20 的一些特征,并且您的测试数据集具有 min=1 和 max=10 的特征。如果在测试中训练单独的缩放器,则测试数据值将低于训练数据集。


推荐阅读