首页 > 解决方案 > 从数据集中提取特定行

问题描述

大家好,我有按邮政编码指定 covid 死亡和感染人数的数据,重要的是要注意,由于本周晚些时候进行的调查等原因,一些邮政编码出现了不止一次。我希望提取两行邮政编码 60618 和邮政编码 60624 的总和以及它们各自名为 Cases...Weekly 的列。下面我包含了我的数据中的代码,所以你可以看到我正在使用什么

head(Chicago_Final), 15)
           Cases...Weekly
1   60601       4   
2   60601       13  
3   60601       1   
4   60601       7   
5   60601       5   
6   60601       8   
7   60601       6   
8   60601       4   
9   60601       NA
10  60601       NA      
11  60601       9   
12  60601       2
13  60601       8   
14  60602       2   
15  60602       NA

如果我需要邮政编码 60601 和 60602,我需要能够生成一个表格,显示每周每行的案件总数以及这两个邮政编码。我正在使用的数据有数千个邮政编码,但为了让事情更容易,我只包括了其中的 15 个。我需要每周提取两个邮政编码及其案例以进行比较。

标签: r

解决方案


不太确定我是否遵循您的问题,但在我看来,您是在询问如何对每个邮政编码的案例进行分组和汇总。您可以使用 来执行此操作aggregate(),但是您需要首先处理 NA 值(通过估算或简单地省略)。使用您提供的数据的示例:

Chicago_Final <- na.omit(Chicago_Final)
aggregate(Chicago_Final$cases, list(zip = Chicago_Final$zipcode), sum)
        zip    x
    1   6601  67
    2   6602  2

您可能需要检查此问题以获得更详细的答案。


推荐阅读