python - Python Keras LSTM 功能顺序相关性
问题描述
我想知道数组上的特征顺序是否会干扰训练模型和验证分数。例如,如果我有这个功能列表来训练我的模型:
[“关闭”,“close_returns”,“log_returns”,“打开”,“open_returns”,“open_log_returns”]
如果我像这样颠倒顺序:
[“关闭”,“打开”,“log_returns”,“close_returns”,“open_log_returns”,“open_returns”]
这对预测模型有什么影响吗?或者排序顺序不会干扰?如果命令干扰。我怎样才能知道野兽命令是什么?
以及我如何知道确定特征是否与我在 Keras 上的 lstm 模型相关?
解决方案
为了确定特征相关性,有几种方法,例如 ALE、Anchors、LIME 和 SHAP。从这些中,我推荐 SHAP,因为它提供了非常好的和信息丰富的可视化,例如力、依赖性和特征重要性图。这是一个使用Keras LSTM 进行 IMDB 情感分类的 Python 笔记本的链接,其中为该特定问题生成了力图。尽管如此,SHAP 也可以应用于回归问题。这是 SHAP API 的另一个链接,您可以在其中找到如何获取其他图。请记住,某些可视化是针对特定样本生成的,例如力图,而其他则针对整个集合(特征重要性)。
有关 SHAP 的工作原理及其优缺点的信息可在此处找到。
推荐阅读
- html - 在组件之间传递数据(从后端 API 获得)在 Angular 中未定义
- r - 使用“facet_wrap”函数时出现“stat_compare_means”的问题
- r - 为 STM 每个主题绘制超过 3 个单词?
- git - 有没有办法使用 GumtreeDiff 来获取两个提交之间的差异信息?
- javascript - 更改一个选择框的值,而另一个选择框在使用 jquery 的 php 中单击不起作用
- flutter - 什么是 Flutter 自定义 ColorSwatch?
- python - Binance 多线程套接字 - 不同时调用的函数
- discord - @client.command 没有运行,discord.py
- javascript - 如何使剩余时间不显示持续时间?
- go - TF401398: 无法激活拉取请求,因为源和/或目标分支不再存在,或者请求的引用不是分支