math - 聚类分析 - 多参数
问题描述
我有一个我试图解决的问题。我有数百个具有相应化学成分的粒子(元素及其重量百分比)。
例如,以下是一些虚构的简化粒子:
粒子 1 - S (32%)、K (25%)、C (43%)
粒子 2 - S (33%)、K (12%)、C (15%)、O (40%)
颗粒 3 - Ti (18%)、S (72%)
颗粒 4 - Ti (10%)、S (79%)、K (12%)
实际上有数百个,其中一些彼此完全不同,其中一些非常相似。如您所见,某些粒子没有某些元素(即它们可以用作 0%)。
我要尝试实现的是进行聚类分析,将粒子分组到具有相似粒子的组中,并就该簇元素组成给出一些平均值。
我正在研究聚类分析的工作原理,但通常它只使用 2 个参数,而每个粒子都有很多元素,我想在聚类时考虑每个粒子的多个元素。我对包含的所有元素的完全匹配不太感兴趣。换句话说,例如,如果某些 2 个粒子非常相似,只是其中一个包含非常少量的一种额外元素,那也可以。非常低的百分比有时是由测量时的背景噪声引起的。
一旦我知道要使用哪种策略,理想情况下我会使用 R 来做到这一点。但是给我一个关于如何去做的提示,或者一个链接,就足够了。
解决方案
推荐阅读
- git - 更改证书外部 CA 后“无法获取本地颁发者证书”
- elasticsearch - Elasticsearch:脚本度量聚合返回奇怪的分组
- c# - reCAPTCHA 在 MVC 部分视图页面中不可见
- angular4-forms - 如何在自定义组件 Angular 4 中访问表单验证
- javascript - 如何配置 StandardJS?
- php - PHP curl Connection timed out error
- android - 数据与服务器同步到房间数据库
- java - 为什么我们不能手动遍历 LinkedList?
- makefile - 为 pdftohtml 制作链接器会导致编译器错误
- laravel - Laravel 5 GET api 调用正在工作,但 POST api 调用不起作用