我正在为 R 做一个家庭作业项目,我有一个需要导入的 CSV 文件,所以对散点图和线性回归进行一些分析并创建。


x <- c("Name", "Washington")

CTD <- subset (Current_Data, grepl(paste(x, collapse = "|"), Current_Data$V1))

所以我是 R 的新手,这是我上过的第一堂课,我用谷歌搜索了一些,确实在这里找到了一个有一些见解的线程,但即使使用该代码,我仍然会出错。(使用 R 对人口数据进行线性回归分析





x <- c("Name", "Washington")

CTD <- subset (Current_Data, grepl(paste(x, collapse = "|"), Current_Data$V1))


C_T_D <- t(CTD)


colnames(C_T_D) <- c("Year","Population")

Current_Data 是完美的(虽然那只是读取 CSV),但是当我到达 CTD 时,我认为有些东西坏了。


    V1      V2      V3      V4      V5      V6      V7      V8      V9     V10
54 Washington 6742902 6821655 6892876 6962906 7052439 7163543 7294680 7425432 7535591



C_T_D 54

因为我已经失去了岁月,所以 Colnames 不起作用并给了我这个错误:

colnames(C_T_D) <- c("Year","Population") dimnames(x) <- dn 中的错误:“dimnames”[2] 的长度不等于数组范围

编辑:这是 Current_Data 的输出。

Current_Data V1 V2 V3 V4 V5 V6 V7 V8 V9 V10 1 NAME 2010 2011 2012 2013 2014 2015 2016 2017 2018 2 United States 309326085 311580009 313874218 316057727 318386421 320742673 323071342 325147121 327167434 3 Northeast Region 55380645 55600532 55776729 55907823 56015864 56047587 56058789 56072676 56111079 4 Midwest Region 66974749 67152631 67336937 67564135 67752238 67869139 67996917 68156035 68308744 5 South Region 114867066 116039399 117271075 118393244 119657737 121037542 122401186 123598424 124753948 6 West Region 72103625 72787447 73489477 74192525 74960582 75788405 76614450 77319986 77993663 7 Alabama4785448 4798834 4815564 4830460 4842481 4853160 4864745 4875120 4887871 8 Alaska 713906 722038 730399 737045 736307 737547 741504 739786 737438 9 Arizona 6407774 6473497 6556629 6634999 6733840 6833596 6945452 7048876 7171646 10 Arkansas 2921978 2940407 2952109 2959549 2967726 2978407 2990410 3002997 3013825 11 California 37320903 37641823 37960782 38280824 38625139 38953142 39209127 t() 函数正在创建一个维度大于 2 的矩阵。错误是说您只给矩阵两个列名,但矩阵数组需要两个以上。

你这样做是有原因的header = F吗?如果没有,那么以下可能会起作用:

Current_Data <- read.csv("nst-est2018-alldata.csv", header=T,stringsAsFactors=FALSE)


x <- c("Name", "Washington")

CTD <- subset(Current_Data, grepl(paste(x, collapse = "|"), Current_Data$NAME))


# the data are in wide format, but you seem to want them in long format
C_T_D <- stack(CTD)[-1,]


# looks like our columns are switched
C_T_D2 <- C_T_D[,c(2,1)]

colnames(C_T_D2) <- c("Year","Population")

#to make the data easier to work with
C_T_D2$Year <- as.numeric(str_extract_all(C_T_D2$Year, "[0-9]+"))
C_T_D2$Population <- as.numeric(C_T_D2$Population)
