首页 > 解决方案 > 为什么我的线性判别分析系数矩阵是 2x1 而不是 2x2?

问题描述

我正在对一些股市数据进行线性判别分析。我正在关注“统计学习简介”第 4 章中的实验室。我的问题涉及 2 个预测变量(x 变量)和 2 个可以分配给它们的类。

我正在使用 scikit 学习来做到这一点。但是,当打印出我的系数矩阵时,我对其尺寸感到困惑。通过系数,我指的是乘以以下等式中的预测值的系数:

在此处输入图像描述

鉴于我的问题中有 2 个预测变量和 2 个可能的类别,我希望这个系数矩阵为 2 x 2。所以每个类别 k 有 2 个系数 - 每个预测变量一个。但是,根据 scikit learn 文档,该数组应具有以下形状:

形状 = [等级,n_classes - 1](https://scikit-learn.org/0.15/modules/generated/sklearn.lda.LDA.html

在我的情况下,排名等于我拥有的预测变量的数量。谁能解释为什么列数是'n_classes - 1',而不仅仅是n_classes?

标签: pythonmachine-learningscikit-learnstatisticslinear-discriminant

解决方案


推荐阅读