python-3.x - RRelief 特征选择,使用来自 skrebate 的 multisurf
问题描述
我是使用 MultiSURF 算法进行特征选择的新手。
我正在使用来自 skrebate 的 MultiSurf。
我有 ~6500 个特征数据集。
该代码花了大约 3 天时间来创建一个距离数组。在过去的 5 天里,它一直停留在“Feature Scoring unedr way...”上。
我究竟做错了什么 ?
以下是代码:
fs = MultiSURF(n_features_to_select=100, verbose=True)
fs.fit(X, y)
print("Printing for FS")
print(fs.feature_importances_)
print(fs.top_features_)
print("Done Printing for FS")
dfDashboard = pd.DataFrame()
for feature_name, feature_score in zip(df.drop(responseCol, axis=1).columns,
fs.feature_importances_):
print(feature_name, '\t', feature_score)
new_record = pd.DataFrame([[feature_name, feature_score]],columns=['FeatureName','Score'])
dfDashboard = pd.concat([dfDashboard,new_record])
有人可以帮助理解吗?MultiSurf 是否不适用于具有 1000 个特征的数据集?
谢谢
解决方案
推荐阅读
- php - Laravel 在课堂上保留数据
- php - 多维数组php中的总和值
- css - 更新文本时在 Chrome 中使用 css 网格滚动生涩
- java - JBoss EAP 7.0.0 OutOfMemoryError: 超出 GC 开销限制
- excel - Excel 中的名称冲突,但没有实际冲突
- python - Python 从共享目录导入文件
- sql - FOR LOOP 迭代的 Oracle SQL 动态 nr
- unity3d - 如何像人头一样限制相机旋转
- vba - 运行时错误 '5' 使用 VBA 定义 Pivot Cache 时过程调用或参数无效
- database - 单独字段中的日期