machine-learning - 在 KMeans 集群上训练神经网络模型
问题描述
我正在对客户的客户进行分类。但是,数据是流动的,集群每天都在变化。
每天运行新的集群来更新用户集群是很困难的,因为 Kmeans 对集群的标注不一致。
如果我们进行聚类,然后使用神经网络或 XGBoost 训练数据,然后向前推进,只需预测聚类即可。这有意义还是做事的好方法?
解决方案
是的,这确实有道理,这只是当时的常规分类任务。在继续使用神经网络之前,您应该有足够的数据分配给集群。
另一方面,您为什么不预测新点的集群而不是更新它们(您可以在sklearn 的文档中看到单独的拟合和预测方法,尽管这取决于您使用的技术)?请记住,神经网络的好坏取决于它的输入(K-Means 集群),它的预测可能与 K-Means 相似。
此外,神经网络更复杂,更难训练,也许那些不应该是你的首选。
您也可以检查模糊聚类的想法,因为数据是流动的,它可能更适合您的情况。也许自动编码器,作为一种获取潜在变量的方法,也可能有用。
推荐阅读
- error-handling - 网络选项卡Magento 2中的严格来源错误
- wpf - 我想访问目前在非公共成员中的 Prism 导航日志回栈
- google-apps-script - 无法运行 Google Apps 脚本,错误 401:disabled_client
- google-chrome - Primefaces 嵌入式 PDF 媒体仅在 Chrome 中显示为“dynamiccontent.properties.jsf”
- java - 在 java 中使用 iCal4J 库在 ics 文件中添加刷新间隔参数
- laravel - 接收货币价格并计算价格
- android - Android 设备的 PWA 中关于 allowbackup 标签的漏洞
- asp.net-core - 将 asp.net 核心部署到 IIS 后,有关 web.config 身份验证部分的错误 500 配置错误
- docker - 用于创建 docker 凭据的 Powershell 脚本
- python - 如何使用 pandas 并获取 csvfile 值