首页 > 解决方案 > 在 RandomForestRegressor 上使用 RFECV 解决回归问题

问题描述

我试图使用 REFCV 从 122 个特征(13783 行)中识别最佳特征。数据是连续数据,我正在尝试识别目标变量 WRT 的最重要特征。我已经完成了通常的训练/测试拆分(80:20)。但是,似乎当我运行我的代码时,它需要永远没有结果,所以我必须停止它。

我有一个苹果 mac pro 2015 处理器:2.7 GHz 双核英特尔酷睿 i5 内存:8 GB 1867 MHz DDR3

下面是我的代码:

#Importing libraries
from sklearn.feature_selection import RFECV
import numpy as np
import matplotlib.pyplot as plt
from sklearn.ensemble import RandomForestRegressor
%matplotlib inline


RF = RandomForestRegressor(n_estimators=100)

# Using RFECV to find the optimum number of best features
rfecv = RFECV(estimator=RF, cv=4)

#Fitting Train data and timing
%%time
rfecv.fit(X_train, y_train)

rfecv.grid_scores_

#Plotting the number of features to visualise optimum number of features
num_features = X_train.shape
num_features[1]

plt.figure(figsize=[10, 5])
plt.plot(range(1, num_features[1]+1), rfecv.grid_scores_)
plt.show()

#features
rfecv.n_features_

标签: pythonmachine-learningscikit-learnfeature-selection

解决方案


尝试调整“步骤”和“min_features_to_select”参数。参考:这里


推荐阅读