machine-learning - 动态环境的机器学习算法
问题描述
哪些方法最适合在动态环境中管理、预测和标记数据?系统数据分布变化,它不是静态的。系统可以有不同的正态设置,在不同的设置下,我们有不同的正态数据分布。考虑我们有两个类。正常和异常。怎么了?我们不能说我们可以依靠历史数据并训练一种简单的分类方法来预测未来的观察结果,因为在训练模型一天后,数据分布可能会发生变化,旧的观察结果将与新的观察结果无关。考虑下图:
蓝色分布和红色分布是正常数据,但在不同的设置下,在训练时我们只有一个设置。该数据适用于一个传感器。所以,假设我们用蓝色模型训练一个模型,并且还有一些异常样本。将异常样本想象为正常样本,在测量中带有一点噪音或故障。然后,我们想测试模型,但设置发生了变化,现在我们有红色分布作为我们的测试观察值。因此,模型对样本进行了错误分类。
对于这种情况,最好的方法是什么?请注意,我尝试了几种聚类算法,但它们无法管理和区分正常和异常样本。
非常欢迎任何建议和帮助。谢谢
解决方案
有很多关于时间序列数据的书籍。
特别是关于变化检测。你的例子可以被认为是平均值的变化。有统计模型可以检测到这一点。
Basseville、Michèle 和 Igor V. Nikiforov。 检测突变:理论与应用。卷。104. 恩格尔伍德悬崖:普伦蒂斯霍尔,1993 年。
推荐阅读
- angular - Angular7 + REDUX:错误:“ExpressionChangedAfterItHasBeenCheckedError:表达式在检查后已更改
- python - 安装 Python 3 模块时的问题
- typescript - 从 firebase-realtime-database 过滤数据
- python - 使用 Python 的 XML 解析问题
- javascript - Laravel MIX,如何在多个文件中使用单个函数
- angular - 构建利用 InjectionToken 的库模块时“无法读取 null 的属性‘类型’”
- tfs - 什么决定了 NuGet 包的 .NET 版本子文件夹和 HintPath,我们如何更改它们?
- javascript - JavaScript:如何重命名 JSON 文件的标题名称
- java - Jackson ObjectMapper readValue 类属性更改时的预期行为
- python - 从 SQL Server 数据库获取表列表作为干净的 Python 字符串列表