首页 > 解决方案 > 查找 gps 数据中的异常值或异常(时间、纬度、经度、高度)

问题描述

我有数据。根据数据(时间、纬度、经度、海拔)确定设备在一周内的典型路线是什么。在确定设备经常光顾的基线路线或典型区域后,我们可以开始根据设备在其频繁路线/区域之外移动来确定异常情况。

行动:然后,该进程将向系统发送“警报”,该系统正在其频繁区域路线之外行驶

请建议哪种机器学习算法有用。我要开始聚类算法了。还告诉我哪些 python 库对使用机器学习算法很有用。

标签: python-3.xmachine-learningdata-science

解决方案


首先,如果你使用 Python,那么使用 scikit-learn。

对于这个问题,有多种可能。

一种方法确实是使用聚类算法。为此,您也可以使用 DBSCAN 来获取异常。它是一种旨在获取聚类和异常值的算法。

另一种方法是(假设您拥有每个设备的所有位置)使用更有趣的方式,例如在所有位置上使用聚类算法来获得重要位置,并在 LDA(潜在狄利克雷分配)之后获得主要主题(这里单词将是集群的索引,文档将是每个设备的位置列表,因此主题将是主要的“路线”)。


推荐阅读