首页 > 解决方案 > 使用 R 提取以 .edu 结尾的网站

问题描述

我正在尝试寻找以 .edu 结尾的网站并获取人们的姓名。这是我到目前为止所拥有的,我不知道如何进行

library(stringr)

educational_institution = merged_data[str_sub((merged_data$Website),-3,-1) , c('LastName', 'FirstName','Website')]
head(educational_institution)

我得到NA了结果。 在此处输入图像描述

标签: rgsub

解决方案


正如@Ronak 在评论中提到的那样,通过可重现的示例为您找到解决方案会容易得多(例如,向我们提供merged_data对象)。但是,如果没有它,您的问题似乎是您没有在方括号内定义逻辑向量。因此,如果您要查找以“edu”结尾的所有行,则需要添加该逻辑语句,== "edu"请参见下面的示例,这可能是您正在寻找的示例。

library(stringr)

educational_institution <- merged_data[str_sub(merged_data$Website,-3,-1) == 'edu', c('LastName', 'FirstName','Website')]
head(educational_institution)

或者使用 dplyr:

library(dplyr)
library(stringr)

educational_institution <- merged_data %>%
  filter(str_sub(Website, -3, -1) == 'edu') %>%
  select(LastName, FirstName, Website)

推荐阅读