python - sklearn随机森林查找所选特征的分数
问题描述
我试图了解每个选定功能获得的相关分数。
到目前为止,我已经尝试过:
classifier =
SelectFromModel(RandomForestClassifier(n_estimators = 100))
m = classifier.fit(train.drop(columns='indicator'), train.rg_risk)
X_train = train.drop(columns='indicator')
selected_feat=X_train.columns[(classifier.get_support())]
len(selected_feat)
解决方案
SelectFromModel 是一种嵌入式方法:它使用具有内置特征选择方法的算法。
在您的情况下,您使用 RandomForest 根据特征重要性选择特征。它使用每个决策树中的节点杂质来计算特征重要性。
通过threshold=None
,最终的特征重要性阈值默认计算为所有决策树特征重要性的平均值。其他可能性是中位数(与均值相同,但使用中位数)或用于调整中位数/均值 ( "1.25*mean"
, "1.25*median"
) 的比例因子。
推荐阅读
- mysql - 获取多个订单产品单位的计数器
- java - 在 Postman 中记录没有 Content-Type 的 Spring 中的请求和响应(包括正文)
- python - ValueError:操作参数必须是 str - Python SQLite
- jquery - json键的索引-1
- vbscript - 编写脚本以本地添加 Windows 10 通知的最佳方法是什么(即没有 BurntToast)
- c - 将指针传递给指针与指向 C 中函数的指针
- node.js - 使用 Mongoose 更新数据库中的数据
- css - 链接 CSS 动画不考虑延迟
- java - 角度和弹簧靴之间的会话
- url - HAProxy - 将 URL 重定向到不同的 URL