首页 > 解决方案 > 聚类分析 - 多参数

问题描述

我有一个我试图解决的问题。我有数百个具有相应化学成分的粒子(元素及其重量百分比)。

例如,以下是一些虚构的简化粒子:

粒子 1 - S (32%)、K (25%)、C (43%)

粒子 2 - S (33%)、K (12%)、C (15%)、O (40%)

颗粒 3 - Ti (18%)、S (72%)

颗粒 4 - Ti (10%)、S (79%)、K (12%)

实际上有数百个,其中一些彼此完全不同,其中一些非常相似。如您所见,某些粒子没有某些元素(即它们可以用作 0%)。

我要尝试实现的是进行聚类分析,将粒子分组到具有相似粒子的组中,并就该簇元素组成给出一些平均值。

我正在研究聚类分析的工作原理,但通常它只使用 2 个参数,而每个粒子都有很多元素,我想在聚类时考虑每个粒子的多个元素。我对包含的所有元素的完全匹配不太感兴趣。换句话说,例如,如果某些 2 个粒子非常相似,只是其中一个包含非常少量的一种额外元素,那也可以。非常低的百分比有时是由测量时的背景噪声引起的。

一旦我知道要使用哪种策略,理想情况下我会使用 R 来做到这一点。但是给我一个关于如何去做的提示,或者一个链接,就足够了。

标签: mathanalysis

解决方案


推荐阅读