r - 有没有可以用权重聚类的算法?
问题描述
X Y Flow
35.829875 128.550225 0.66
35.64903952 128.4373915 2.36
35.87826747 128.6094381 2.09
35.83962222 128.5711917 0.77
35.94296667 128.5503917 3.99
35.94184918 128.5629876 5.86
35.87022926 128.6917042 4.13
35.84118463 128.610549 16.61
35.84861677 128.6244008 0.04
35.86461772 128.595875 0
以上数据为流动人口数据的一部分。'X'和'Y'是经纬度,'Flow'代表流动人口数量。我们想基于 Flow 对 X 和 Y 变量进行权重聚类,然后找到中心点。这可能吗?
- 我最初想使用 k 方法创建多个集群。不知道Flow变量是否可以在不改变X和Y的值的情况下影响两个变量的聚类。我想要一些中心点。我的解释缺乏,因为我是分析的初学者。请理解。
解决方案
大多数聚类算法可以很容易地加权。
- 在 k-means 中,使用加权平均值
- 在层次聚类中你已经使用了权重,它们最初是 1 - 只是设置它们不同
- 在 DBSCAN 中,使用权重的太阳而不是计数来查找核心点
- 还有很多
但是很少有库对此提供支持,您需要编写自己的代码。
推荐阅读
- spring - 调用@CacheEvict 注解
- java - 链接到 docker 容器随机导致 TimeOut 异常
- mysql - 如何检索由逗号分隔的字段中的 MAX 数和变量
- typescript - Cloud Functions-TypeScript-“对象可能是‘未定义’.ts(2532)”
- css - 手机标题图片太小
- dart - 如何将 scoped_model 与 Navigator 一起使用?
- c# - 在 Automapper 中更新目标属性
- javascript - php 代码运行时在屏幕上写字
- amazon-web-services - 与 AWS EC2 的 SSH 连接在连接或构建时冻结
- typescript - 无法获得通用的联合打字?