首页 > 解决方案 > 查找原始特征对用作内核 PCA 输入的主成分的影响

问题描述

我正在尝试对我的数据集实施内核 PCA,该数据集具有分类(用一个热编码器编码)和数字特征,并将维度的数量从 22 维减少到 3 维。之后,我将继续集群实现。我使用 Spyder 作为 IDE。为了从算法中了解我生成的集群的结构,我想解释哪些特征影响派生的主成分以及它们如何影响它们。可能吗?如果是这样,我该如何解释,有什么方法吗?

标签: pythonmachine-learningcluster-analysispcakernel-density

解决方案


由于您在内核空间中应用 PCA,因此与您的原始特征和缩减数据的特征之间存在严格的非线性关系;您计算的特征向量一开始就在内核空间中。这阻碍了直接的方法,但也许您可以进行某种敏感性分析。对原始特征应用小扰动,并测量最终的、减少的特征对它们的反应。最终特征相对于原始特征的雅可比也是一个很好的起点。


推荐阅读