python - 在 Python 中使用机器学习分类预测时间窗口中的故障概率
问题描述
我想预测机器的故障。我拥有的数据是每天的数据,包含“运行分钟数”、“外部冲击次数”或“运营商名称”等信息。我创建了额外的因素来存储与时间相关的数据,即“自上次故障以来的累计运行分钟数”。请参阅下面的 df 以了解数据的样子
df = pd.DataFrame(
{"date" : ["2019/04/24" , "2019/04/25", "2019/04/26", "2019/04/27", "2019/04/28"],
"minutes in operation" : [200, 200, 200, 200, 200],
"accumulated minutes in operation since last break down" : [200, 400, 600, 800, 1000],
"breakdown" : [0, 0, 0, 0, 1]},
index = [1, 2, 3, 4, 5])
这个想法是,使用机器学习正确地将故障日与非故障日分类。每天的预测都很糟糕,这并不是特别糟糕,因为我不需要预测“它会在那一天失败”。如果我能预测它会“在接下来的三天内失败”,那就太好了。
因此,我考虑了两种解决方案:
- 将事件前 2 天标记为“1”(“细分”:[0, 0, 1, 1, 1])。有了这个,我产生了非常好的预测结果。
- 将连续 3 天聚合到一个观察行并在聚合级别上进行预测。
我想知道这是否是预测“在 3 天的时间窗口内发生事件”的正确方法,或者是否有更 ML-pythonic 的方法。
解决方案
推荐阅读
- python - 查找 Pandas 中出现一系列值的开始和结束日期
- ios - 如何使用 ZStack 和 SwiftUI 剪辑子视图?
- angular - 在 Angular 中链接 RESTful 端点调用
- excel - 在VBA中如何保留两个工作表并删除其他工作表
- python - PIL.Image.paste 实际上并不粘贴图像
- python - Celery 确保任务在不同节点上运行
- javascript - Vue.js 没有得到 mqtt 响应消息
- css - 在 Bootstrap3 中将输入字段对齐到按钮工具栏的左侧
- amazon-s3 - 为什么当使用 post presigned url 上传文件时,返回的响应没有密钥
- asp.net - ASP VB.net 如何避免在以编程方式在网格视图中创建的链接按钮单击时刷新整页