首页 > 解决方案 > 在 KMeans 集群上训练神经网络模型

问题描述

我正在对客户的客户进行分类。但是,数据是流动的,集群每天都在变化。

每天运行新的集群来更新用户集群是很困难的,因为 Kmeans 对集群的标注不一致。

如果我们进行聚类,然后使用神经网络或 XGBoost 训练数据,然后向前推进,只需预测聚类即可。这有意义还是做事的好方法?

标签: machine-learningneural-networkk-meansxgboostlightgbm

解决方案


是的,这确实有道理,这只是当时的常规分类任务。在继续使用神经网络之前,您应该有足够的数据分配给集群。

另一方面,您为什么不预测新点的集群而不是更新它们(您可以在sklearn 的文档中看到单独的拟合和预测方法,尽管这取决于您使用的技术)?请记住,神经网络的好坏取决于它的输入(K-Means 集群),它的预测可能与 K-Means 相似。

此外,神经网络更复杂,更难训练,也许那些不应该是你的首选。

您也可以检查模糊聚类的想法,因为数据是流动的,它可能更适合您的情况。也许自动编码器,作为一种获取潜在变量的方法,也可能有用。


推荐阅读