python-3.x - 我们可以将特征缩放应用于数据集中的“自变量”吗?
问题描述
我有一个包含 8 个因变量(2 个分类数据)的数据集。我已申请ExtraTreeClassifier()
消除一些因变量。我还有 X,y 的特征比例。
from sklearn.preprocessing import StandardScaler
sc = StandardScaler()
X = sc.fit_transform(X)
X = sc.transform(X)
y = sc.fit_transform(y)
y = sc.transform(y)
在此之后,我将数据集拆分为
from sklearn.cross_validation import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X_new, encoded2,
test_size = 0.25, random_state = 0)
现在我正在应用DecisionTreeRegressor
算法进行预测。但我想要实际的预测(现在我得到了缩放值)。怎么做?有没有其他方法可以做到这一点?因为我所做的方式是给 RMSE = 0.02,如果我不是特征缩放因变量 RMSE = 18.4。请建议如何解决此类问题。
解决方案
好吧,首先,y
不需要缩放目标变量(StandardScaler
inverse_transform
从以下文档StandardScaler
:
inverse_transform(X[, copy])
将数据缩小到原始表示
推荐阅读
- python - (Python)如何使用 for 循环打印具有特定数字的三角形?
- kotlin - kapt 中的 ArrayIndexOutOfBoundsException
- r - 使用 ifelse 编辑具有多个时间点的数据框
- drop-down-menu - Yii 1 - listData() & dropdownList()
- php - 在 mySQL 查询结果中执行 PHP 用户函数
- excel - 检测图像的粘贴事件
- excel - 使用 Shapes.AddPicture 方法将位图图像嵌入 Excel 合并单元格
- r - 按变量拆分列并创建新列 R
- java - JavaFX - 从通知弹出窗口中检索对象
- sql - 按记录数选择前 1