python - SequentialFeatureSelector 中的“ci_bound”是什么意思?
问题描述
我正在关注有关使用数据集逐步回归的在线教程之一boston
。代码没有任何问题,但我只想了解我所看到的。所以我在下面运行了前向选择:
sfs = SFS(LinearRegression(),
k_features=(3,11),
forward=True,
floating=False,
scoring='neg_mean_squared_error',
cv=4)
sfs.fit(X, y)
之后,我在 DataFrame 中可视化数据,如下所示:
pd.DataFrame.from_dict(sfs.get_metric_dict()).T
列中的值ci_bound
是什么意思?
解决方案
看起来您正在使用 mlxtend 的SequentialFeatureSelector
. 这个家族的算法所做的是添加或删除特征并分析它们对算法指标的影响。如文档中所述,ci_bound
为您提供confidence interval around the computed cross-validation scores
. 默认情况下,使用95%
置信区间,但您可以使用 将其设置为另一个值confidence_interval
。
置信区间大概是通过重复交叉验证K
时间(K-Fold cross validation)获得的。因此,您在生成的数据框中看到的是使用给定特征子集进行估计得出的分数,以及与这些分数相关的置信区间。
推荐阅读
- javascript - 使用 Javascript 将大数据文件上传到 OneDrive
- c# - 在DataTable c#中通过itemArray值查找DataRow
- ios - 查找具有匹配键的字典值的总和
- python - 有没有办法在不使用 mongodb 的情况下将 pymongo 连接到本地文件?
- javascript - 在桌面上显示移动导航
- html - 在同一行上动态打印 3 行
- reactjs - 反应上下文返回未定义
- mongodb - 在 mongo db 中查找二级嵌入文档的计数
- c++ - 无法使用 RNG 在 Botan 中初始化 McEliece 函数
- flutter - 在颤动中定义状态