首页 > 解决方案 > 通过R中的数据表迭代过滤

问题描述

我有一个包含 3 个变量、1 个频率列的数据表,我希望添加另一个比例列。

变量 1 有 4 个唯一值。变量 2 有 5,变量 3 有 2。

在此处输入图像描述

频率记录了发生的次数。但是,如果我将 prop.table 添加到它,它将计算整个 data.table 的比例,而我真的希望它计算变量 2 的子集中的比例。

我想过迭代,但在表格中似乎很复杂。

标签: rloopsfilter

解决方案


您可以使用该aggregate函数(或 tapply)对变量 2 类别中的所有计数求和,然后prop.table在结果上使用或类似。

如果您想使用 tidyverse 而不是 base R,那么这将是在每个组中添加,然后group_by再次计算比例。summariseprop_table


推荐阅读