首页 > 解决方案 > 无监督学习 python:x,y,z 运动聚类

问题描述

我有一个由 3000 个观察值组成的数据集。对于每个观察,我有 4 个特征:时间、x 轴上的位置、y 轴上的位置、z 轴上的位置。这些数据与车辆的加速度有关。基本上,车辆可以处于三种状态:加速、减速和保持相同速度。这些状态在数据集中重复(车辆加速、减速、停止,然后重复序列)。

我想在这些类别中对我的数据集进行聚类,然后使用聚类结果向数据集添加一个新列。

我尝试应用 KMeans(在标准化数据之后),但我获得了三个相同维度的集群(对我来说这很奇怪,因为加速和减速比停止持续时间更长),它们不会重复。基本上,就好像 KMeans 只是将数据集分成相等的部分,而不考虑数据集的特征。

也许我应该使用不同的算法?我应该从不同的角度来处理这个问题吗?

数据集的样本: 样本数据集

我试图提取速度和加速度的值。现在的问题是我在标准化数据集方面遇到了问题

ValueError: Input contains infinity or a value too large for dtype('float64').

标签: pythonscikit-learnk-meansunsupervised-learning

解决方案


推荐阅读