machine-learning - 对也有分类标签的数据进行聚类的方法?
问题描述
我有一个数据集,其中每一行代表一个人及其全年的付款行为。对于每个人,我有 3 个可能的分类标签(年龄、性别、国籍)。支付行为由 30 多个指标定义,例如支付次数和支付价值。生成的数据集示例如下所示(我在右侧包含了一些随机支付行为指标):
我的目标是创建代表具有相似支付行为的同质人群的类(基于年龄/性别/国籍的组合)。例如:我们发现美国50-60岁的男性都有类似的支付行为。例如,对于每个类,我可以确定平均值、标准差、百分位数等。由于这似乎是聚类和分类之间的重叠,所以我被困在研究什么和去哪里寻找。有什么我可以研究的方法吗?
我正在考虑的一个选项是首先创建所有可能的类(例如 50-M-US、50-F-US、51-M-US 等),然后根据欧几里得距离合并它们(使用所有付款行为指标意味着)直到剩下所需数量的类。让我知道你的想法。
解决方案
推荐阅读
- sas - 为什么在运行逐步回归时在 SAS 中出现堆栈溢出错误
- ubuntu - Ejabberd:安装期间的故障转储
- c# - pinvoke:线程与共享内存缓冲区
- python - 在 seaborn 中创造人工传奇
- amazon-web-services - 在 AWS 负载平衡的侦听器选项卡上找不到密码列
- sql - 用于在 Web 开发中存储数据的文本文件与 SQL 数据库
- android - 如何将 NavigationDrawer 与 TabLayout 和几个 Fragment 链接?
- flutter - Youtube Private Streaming in app 并检查用户是否为付费视频付费。?
- html - 在 html 页面中禁用动画 PNG
- character - 扫描条码后删除第一个字符