首页 > 解决方案 > RRelief 特征选择,使用来自 skrebate 的 multisurf

问题描述

我是使用 MultiSURF 算法进行特征选择的新手。

我正在使用来自 skrebate 的 MultiSurf。

我有 ~6500 个特征数据集。

该代码花了大约 3 天时间来创建一个距离数组。在过去的 5 天里,它一直停留在“Feature Scoring unedr way...”上。

我究竟做错了什么 ?

以下是代码:

    
    fs = MultiSURF(n_features_to_select=100,  verbose=True)

    fs.fit(X, y)

    print("Printing for FS")
    print(fs.feature_importances_)
    print(fs.top_features_)
    print("Done Printing for FS")

    dfDashboard = pd.DataFrame()

    for feature_name, feature_score in zip(df.drop(responseCol, axis=1).columns,
                                           fs.feature_importances_):
        print(feature_name, '\t', feature_score)

        new_record = pd.DataFrame([[feature_name, feature_score]],columns=['FeatureName','Score'])
        dfDashboard = pd.concat([dfDashboard,new_record])

有人可以帮助理解吗?MultiSurf 是否不适用于具有 1000 个特征的数据集?

谢谢

标签: python-3.xfeature-selection

解决方案


推荐阅读