首页 > 解决方案 > 特征选择和低 Pearson's R

问题描述

我正在尝试进行特征选择过程,因为 df 中有 +100 列。

当输入'n_features_to_select=1'时,RFE 建议特征 A作为最佳特征。

问题是y特征 A之间的 Pearson 的 R仅为0.1,这似乎太低无法解释 y。但是,仅特征 A整个特征之间的预测分数几乎相似,这意味着特征 A 可以成为一个好的模型。

那么,特征选择和 Pearson's R 之间有什么关系吗?高 Pearson's R 不能保证应该选择该功能吗?

标签: pythonregressionpearson-correlation

解决方案


推荐阅读