首页 > 解决方案 > 我们可以将特征缩放应用于数据集中的“自变量”吗?

问题描述

我有一个包含 8 个因变量(2 个分类数据)的数据集。我已申请ExtraTreeClassifier()消除一些因变量。我还有 X,y 的特征比例。

 from sklearn.preprocessing import StandardScaler
 sc = StandardScaler()
 X = sc.fit_transform(X)
 X = sc.transform(X)
 y = sc.fit_transform(y)
 y = sc.transform(y)

在此之后,我将数据集拆分为

from sklearn.cross_validation import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X_new, encoded2, 
test_size = 0.25, random_state = 0)

现在我正在应用DecisionTreeRegressor算法进行预测。但我想要实际的预测(现在我得到了缩放值)。怎么做?有没有其他方法可以做到这一点?因为我所做的方式是给 RMSE = 0.02,如果我不是特征缩放因变量 RMSE = 18.4。请建议如何解决此类问题。

标签: python-3.xmachine-learningdata-science

解决方案


好吧,首先,y不需要缩放目标变量(StandardScalerinverse_transform

从以下文档StandardScaler

inverse_transform(X[, copy]) 将数据缩小到原始表示


推荐阅读