首页 > 解决方案 > R包mrmre分数计算与提取

问题描述

我正在使用一个名为 mRMRe 的 R 包来帮助我进行一些快速的功能选择,但我发现这个包的文档非常混乱。

我的数据集有大约 400 列/特征,最后一列是二元结果。

基本上,我这样计算 MRMR 分数:

tmp.step4 <- mRMR.classic( "mRMRe.Filter", 
                           data = myDataset , 
                           feature_count = featureCount( myDataset ) - 1, 
                           target_indices = 400 )

由于我不知道我真正需要多少特征,我想计算每个特征的 MRMR 分数,我可以根据分数进行逐步变量消除。

我这样检索 MRMR 计算结果:

scores( tmp.step4 )
solutions( tmp.step4 )

我可以看到解决方案函数的输出是一个数值列表,我假设它是我的列/特征编号的索引。score 函数的输出函数是一个排序后的数值向量,但我不认为这与我的特征直接对应(例如一对一投影)。

我的问题很简单:

如何让分数与功能名称配对?
如:
feature.1:0.111
feature.2:0.222
feature.3:0.333
...

非常感谢

标签: rmachine-learningfeature-selectionfeature-engineering

解决方案


经过一番挖掘工作,我想我明白了......

分数需要与解决方案配对,它给出了我的数据集的有序列索引。然后,可以相应地映射分数。


推荐阅读