首页 > 解决方案 > 用 R 将县级数据分组到各州

问题描述

我正在尝试使用位于以下位置的约翰霍普金斯大学 COVID-19 数据来学习 R:

https://github.com/CSSEGISandData/COVID-19/tree/master/csse_covid_19_data/csse_covid_19_time_series

我正在尝试使用 time_series_covid19_confirmed_US.csv 文件。数据采用时间序列格式,分辨率低至县级。我想处理每天的州级总数。我能够删除我不需要的信息列,但在尝试将县分组为州时遇到了困难。

标签: r

解决方案


这是一种方法dplyr。我们可以使用该RCurl库轻松下载数据。

library(RCurl)
library(dplyr)
url <- "https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_covid19_confirmed_US.csv"
raw <- getURL(url)
data <- read.csv(text=raw)
data %>%
   group_by(Province_State) %>%
   summarise_at(vars(ends_with("20")), sum)
## A tibble: 58 x 78
#   Province_State X1.22.20 X1.23.20 X1.24.20 X1.25.20 X1.26.20 X1.27.20 X1.28.20 X1.29.20 X1.30.20 X1.31.20 X2.1.20 X2.2.20 X2.3.20 X2.4.20
#   <fct>             <int>    <int>    <int>    <int>    <int>    <int>    <int>    <int>    <int>    <int>   <int>   <int>   <int>   <int>
# 1 Alabama               0        0        0        0        0        0        0        0        0        0       0       0       0       0
# 2 Alaska                0        0        0        0        0        0        0        0        0        0       0       0       0       0
# 3 American Samoa        0        0        0        0        0        0        0        0        0        0       0       0       0       0
# 4 Arizona               0        0        0        0        1        1        1        1        1        1       1       1       1       1
# 5 Arkansas              0        0        0        0        0        0        0        0        0        0       0       0       0       0
# 6 California            0        0        0        0        2        2        2        2        2        3       3       3       6       6

推荐阅读