matlab - Matlab 究竟如何执行 Lasso 分类?
问题描述
我正在对 Lasso 分类方法进行一些研究。我有一个 40x15 的数据集,我想开发一个二项式方程而不将数据分成训练集和测试集(因为样本量小)。
我需要一些关于 Matlab 如何准确执行 LASSO ( lassoglm ) 的具体细节。我知道它如何通过对系数应用惩罚项来删除无关紧要的项的一般概念,我也知道CV以及它如何获取数据子集并对该子集执行分析,但我仍然有一些具体的关于Matlab中LASSO过程的问题。
我想知道:
- 在不使用CV并且只执行B=lassoglm(X,Y)的情况下, B的值是多少?它是我可以用于二项式方程的X系数矩阵吗?
- 在不使用CV的情况下,我是否仍然能够提取Index1SE和IndexMinDeviance以获得对我的模型有贡献的最重要的术语?
- 当CV找到 lambda 的最佳值时,例如,当我使用CV=10时,Matlab 如何执行套索(lambda=100)?Matlab 是否对每个 lambda 值执行不同的分析?如果是这样,如何?以及它如何绘制具有不同误差线的Lambda-Deviance图?
- 最后,我是否可以忽略CV并进行简单的 Lassoglm 分类,但仍然从我的 15 个项中找到最好的、重要的项,然后形成一个二项式公式(具有截距、C 和 X 系数)
解决方案
推荐阅读
- python - Python菜鸟问题:多项式乘法问题
- python - Airflow 无法使用 SSH 私钥连接到 SFTP
- csv - 来自 csv 的 HIVE 表不会跳过标题
- angular - 带有可观察令牌的 Angular CanActivate 不等待
- azure-storage - CloudBlockBlob DownloadTextAsync 行为差异
- c# - 从不同的类触发 RaisePropertyChanged
- c# - 如何制作线程安全的静态属性?
- reactjs - 要随着时间的推移保留该值,请将其存储在 useRef Hook 中并将可变值保留在“.current”属性中
- javascript - symfony 在获取后找不到发布数据
- r - 在 R 中导入 Excel 表格