首页 > 解决方案 > 集群后,我如何从顶级集群中选择最佳客户(子集)?

问题描述

我使用 K-Means(基于 3 个 PCA 维度和 5 个 PCA 维度)和 GMM(使用 5 个 PCA 维度)方法进行了聚类练习,以基于 12 个不同的特征来识别我的主要客户。K-Means 的两个输出都产生了几乎相似的客户作为最佳集合(每种情况下有 1182 个客户,重叠 1156 个),而 GMM 方法给了我 660 个客户作为我的顶级客户。这 660 位客户同时出现在这两种 K-Means 方法中。

现在我想从这个列表中找出我的主要客户是谁。您能否建议我可以使用的任何统计方法来说明这些 X 数量的客户确实是我最好的集合并对其进行一些 A/B 测试?我不想使用完整的标识集,因为为如此庞大的客户集执行计划可能会花费我更多。

标签: pythoncluster-analysisunsupervised-learning

解决方案


尝试一些好的旧过滤器!选择一个或几个特征,创建你自己的指标(也许顶级客户是那些购买最多的人,或者那些更忠诚/在公司停留更长时间的人,或者这两个因素的加权总和),对你的 660 个客户进行排序集群并只选择 N 个第一个客户,N 是您允许的最大客户数。


推荐阅读