首页 > 解决方案 > 你如何呈现一个表格(和图表)来说明 R 中排列组大小的频率?

问题描述

我正在尝试弄清楚如何在表格和图表中通过我的数据的排列组大小来说明频率(组数)。

我的数据由分配的 8 个变量(犬种)“my_col”和分配的 3 个级别(颜色)“my_lev”组成。我生成了一个包含 50,000 个输出的随机数据集。到目前为止,我已经计算出有 6,557 个可能的唯一行(即类别级别的排列)。

由于这是一个随机数据集,因此有一些类似的数据行,如快照表中的 COUNT 所示;

df[, .(COUNT = .N), by = names(df)]

    Poodle Labrador   Pug Chihuahua Collie Shitzu Bulldog Lurcher COUNT
1:  brown    brown black     black  brown  white   black   white     8
2:  black    white brown     white  black  brown   brown   brown     7
3:  white    black brown     brown  black  black   black   black     6
4:  brown    brown brown     brown  brown  black   black   white    11
5:  brown    black black     black  white  white   brown   white    10
---
6553:  brown    black white     black  brown  white   black   brown     3
6554:  brown    black white     white  white  brown   black   white     1
6555:  brown    black white     white  brown  black   brown   black     1
6556:  black    white brown     brown  black  white   black   black     1
6557:  white    white white     black  brown  white   brown   white     1

我想最终得到一个带有 2 个标题的新表格,“组大小”和“否”。组的。

如何计算有多少组是唯一组合(组大小 = 1),有多少组由一对匹配组合组成(组大小 = 2),有多少组由三个相同的组合组成,等等?

标签: rdatatablepermutationfrequencycategorical-data

解决方案


推荐阅读