首页 > 解决方案 > 回归与分类可以解决的问题

问题描述

我有一个问题,我一直将其视为分类问题。我试图根据一些输入特征来预测机器是否会通过或失败特定的测试。

我真正感兴趣的实际上是预测一台新机器是否会通过测试。它可以通过使某些特征(例如速度、振动等)超出范围来通过或失败测试。

因此,我可以:

1)将其视为纯回归问题;尝试预测速度、振动等的实际值

2)将其视为纯分类问题;对于每个观察,在标签上输入它是通过还是失败,并尝试在我正在制作的工具中预测这一点

3)将其视为伪问题;我在其中预测实际值,并根据与通过/失败阈值的距离来衡量我对它是通过还是失败的信心

要清楚;我正在解决一个真正的问题。我对获得某个值的超精确预测不感兴趣,只是预测一台机器是通过还是失败(以及奖励扩展;它是真实的可能性有多大)。

我一直在使用分类模型,因为我只有几百个观察结果,并且之前的一些研究表明这可能是处理该问题的最佳方法。但是我现在想知道这是否是正确的做法。

你会怎么做!?

非常感谢。

标签: pythonmachine-learningregressionclassification

解决方案


如果没有数据和运行分类或回归,比较会很困难,因为您为每个家庭使用的指标是不同的。例如,将回归的 RMSE 与分类问题的 F1 分数(或准确性)进行比较将是苹果与橙色的比较。

如果您可以训练一个良好的回归模型(低 RMSE),那将是理想的,因为这将为您提供比原始通过/失败问题更多的信息。根据我过去与工业客户的经验,

首先,训练您提到的所有 3 个模型,然后将结果展示给您的客户,让他们为您提供更多指导,了解哪些模型/输出对他们更有意义。


推荐阅读