python - 查找原始特征对用作内核 PCA 输入的主成分的影响
问题描述
我正在尝试对我的数据集实施内核 PCA,该数据集具有分类(用一个热编码器编码)和数字特征,并将维度的数量从 22 维减少到 3 维。之后,我将继续集群实现。我使用 Spyder 作为 IDE。为了从算法中了解我生成的集群的结构,我想解释哪些特征影响派生的主成分以及它们如何影响它们。可能吗?如果是这样,我该如何解释,有什么方法吗?
解决方案
由于您在内核空间中应用 PCA,因此与您的原始特征和缩减数据的特征之间存在严格的非线性关系;您计算的特征向量一开始就在内核空间中。这阻碍了直接的方法,但也许您可以进行某种敏感性分析。对原始特征应用小扰动,并测量最终的、减少的特征对它们的反应。最终特征相对于原始特征的雅可比也是一个很好的起点。
推荐阅读
- oauth-2.0 - Oauth2 令牌请求不包含 redirect_uri
- javascript - 有人如何循环 JSON 并操作其值(转换为字符串、设置固定小数并添加千位分隔符)?
- anaconda - Anaconda 不启动 - attributeError: 模块 'six' 没有属性 'add_metaclass'
- reactjs - 反应材料选择中的自定义菜单项和布局
- http - OPLON LBL ADC:如何为虚拟域设置“粘性会话”?
- c# - 参考搜索不考虑包\包名
- c# - 如何将数据发布到 Dynamics 365 多选选项列表?
- c# - 如何在 .net 核心控制器中返回 Json 对象?
- elasticsearch - Elasticsearch 中的一致性和分区容错性
- java - 使用 Undertow WebSockets 高效发送大型数据集