首页 > 解决方案 > Python Keras LSTM 功能顺序相关性

问题描述

我想知道数组上的特征顺序是否会干扰训练模型和验证分数。例如,如果我有这个功能列表来训练我的模型:

[“关闭”,“close_returns”,“log_returns”,“打开”,“open_returns”,“open_log_returns”]

如果我像这样颠倒顺序:

[“关闭”,“打开”,“log_returns”,“close_returns”,“open_log_returns”,“open_returns”]

这对预测模型有什么影响吗?或者排序顺序不会干扰?如果命令干扰。我怎样才能知道野兽命令是什么?

以及我如何知道确定特征是否与我在 Keras 上的 lstm 模型相关?

标签: pythontensorflowkeraslstmpredict

解决方案


为了确定特征相关性,有几种方法,例如 ALE、Anchors、LIME 和 SHAP。从这些中,我推荐 SHAP,因为它提供了非常好的和信息丰富的可视化,例如力、依赖性和特征重要性图。这是一个使用Keras LSTM 进行 IMDB 情感分类的 Python 笔记本的链接,其中为该特定问题生成了力图。尽管如此,SHAP 也可以应用于回归问题。这是 SHAP API 的另一个链接,您可以在其中找到如何获取其他图。请记住,某些可视化是针对特定样本生成的,例如力图,而其他则针对整个集合(特征重要性)。

有关 SHAP 的工作原理及其优缺点的信息可在此处找到。


推荐阅读