首页 > 解决方案 > 回归还是分类?

问题描述

当使用神经网络预测制造过程的错误百分比时,如果过程中有一些我们无法控制(随机)的输入,最好使用回归还是分类?

例子,

输出可以是从 -900% 到 +900% 的错误率,平均和中值错误为 9%(它是一个肥尾钟形曲线)。我们是否应该使用回归并尝试预测误差量或将误差分类为中位数的 sigmas,例如 900% 是中位数的 5 个 Sigmas。因此,我们将有 11 个类别 -5 到 +5

标签: neural-networkartificial-intelligence

解决方案


输出取决于您的用例,而不是数据。训练此模型后,您将通过给它一个输入向量(一系列输入)来使用它。您的模型将产生一个输出编号。你打算用这个输出数字做什么?为了争论起见,让我们从积极的一面考虑两个相似的预测。

您的输出是 +2、+2(分类)或 +350%、+380%(回归)。

您是否需要对两个输出做出相同的反应?大约 +2 的所有内容是否都接受相同的处理 - 如果是,您有明确的分类案例 - 或者基于相对大小是否存在细微差异 - 建议使用回归模型。

另外,您正在考虑哪些模型类型?如果您已经选择了一个相对简单的 ANN,那么您不妨将其设为回归模型,并在预测中获得额外的“准确性”。如果您发现某些非线性函数的优势或类别的简单性(与为回归方程尝试各种非线性项相反),请使用分类方法。


推荐阅读