首页 > 解决方案 > 模型架构和训练参数是什么意思?

问题描述

我正在研究一些机器学习方法,例如 Python 中的支持向量机、K-Nearest Neighbor 和 Isolation Forest,但我有一个问题,关于这些方法的模型架构和训练参数是什么意思?

标签: machine-learning

解决方案


当您提到神经网络时,我建议您使用术语模型架构。您可以将模型架构想象成乐高积木。有不同的大小(每个隐藏层中的单元数)和颜色(不同的层:LSTM、卷积、线性/密集等),可用于构建您希望的任何简单到复杂的架构。

您提到的机器学习模型:SVM、k-NN、隔离森林是允许您执行分类或回归的监督算法。这里没有建筑。然而,每种算法都采用不同的方法来解决问题。例如,SVM 旨在在 N 维空间(N = 特征数)中找到一个对数据点进行明确分类的超平面,而 k-NN 通过其 k 个邻居的多次投票对数据点进行分类。

有两种参数:模型参数和超参数。前者是在训练阶段学习的,后者必须在训练阶段之前设置。如果您的数据质量很好并且您的问题不是很复杂,那么由于优化算法,您将在训练阶段学习正确的模型参数。但是,超参数是特定于问题的,并且在算法之间有所不同。例如,在 SVM 中,最重要的超参数之一是C,它是误差项的惩罚参数。它控制平滑决策边界和正确分类训练点之间的权衡。

通常,选择默认的超参数不是一个好习惯,因此,我建议您执行超参数调整。这是一个帮助您入门的链接。


推荐阅读