首页 > 解决方案 > R如何选择几行来制作一个新的数据框

问题描述

我有一个包含 5000 多个观察值的数据框。在我尝试使用层次聚类分析我的数据时,我有 8 个聚类,其中一些行包含几个 1000 或 100 个观察值。

# Cut tree into 8 groups
cutree_hclust <- cutree(hclust.unsupervised, k = 8)

# Number of members in each cluster
table(cutree_hclust)

cutree_hclust
   1    2    3    4    5    6    7    8 
  486   61  14    3   15    2    9    5 

为了了解不同集群中每个观察值的变量组合,我认为将 8 个集群作为数据框可能是一个想法,因此我可以分别分析它们。这是因为我不知道不同列中有哪些不同的行,因此不知道整个数据帧(Complete_df)中的模式是什么。

但是,我怎样才能制作这些新的数据框?

我可以通过 fx 查看不同集群中的哪些行:

rownames(MY_df)[cutree_hclust == 7]

[1] "65"  "21"  "21"  "70"  "101" "104" "112" "673"
[9] "651"

但是如果我输入

h_clust <- as.dataframe( rownames(MY_df)[cutree_hclust == 7])

我只得到这个集群中有哪些行的视图(作为列表),并且不包括所有其他列。

但是我怎样才能把它变成一个数据框,而不必用方括号输入行/列序列5000次呢?

标签: rdataframerowhierarchical-clusteringunsupervised-learning

解决方案


推荐阅读