python - 回归与分类可以解决的问题
问题描述
我有一个问题,我一直将其视为分类问题。我试图根据一些输入特征来预测机器是否会通过或失败特定的测试。
我真正感兴趣的实际上是预测一台新机器是否会通过测试。它可以通过使某些特征(例如速度、振动等)超出范围来通过或失败测试。
因此,我可以:
1)将其视为纯回归问题;尝试预测速度、振动等的实际值
2)将其视为纯分类问题;对于每个观察,在标签上输入它是通过还是失败,并尝试在我正在制作的工具中预测这一点
3)将其视为伪问题;我在其中预测实际值,并根据与通过/失败阈值的距离来衡量我对它是通过还是失败的信心
要清楚;我正在解决一个真正的问题。我对获得某个值的超精确预测不感兴趣,只是预测一台机器是通过还是失败(以及奖励扩展;它是真实的可能性有多大)。
我一直在使用分类模型,因为我只有几百个观察结果,并且之前的一些研究表明这可能是处理该问题的最佳方法。但是我现在想知道这是否是正确的做法。
你会怎么做!?
非常感谢。
解决方案
如果没有数据和运行分类或回归,比较会很困难,因为您为每个家庭使用的指标是不同的。例如,将回归的 RMSE 与分类问题的 F1 分数(或准确性)进行比较将是苹果与橙色的比较。
如果您可以训练一个良好的回归模型(低 RMSE),那将是理想的,因为这将为您提供比原始通过/失败问题更多的信息。根据我过去与工业客户的经验,
首先,训练您提到的所有 3 个模型,然后将结果展示给您的客户,让他们为您提供更多指导,了解哪些模型/输出对他们更有意义。
推荐阅读
- python - 如何将图例变成下拉列表?
- firebase - Firestore 与其他用户共享数据
- c++ - 序列和最大,最小与向量
- c# - 创建用于获取肥皂消息的 Web 服务
- c# - System.Windows.Forms.Application.Run 错误
- java - JPopupMenu 绘制了 JDesktopPane 的主要部分
- php - Laravel 6 使用错误密码登录会导致 file_put_contents 错误
- java - 将绘制的(和可编辑的)矩形添加到包含滑块和文本字段的网格数组
- java - 如何从 DynamoDb 获取价格列表
- javascript - 使用 AM/PM 将 Javscript 转换为 LocalTimeString HH:MM:SS 到 HH:MM