r - 从R中的文件路径中提取TOP目录
问题描述
我需要有关如何从给定路径中提取第一个(或)顶级目录的指导。这包括第一个斜线和最后一个斜线。例如,在路径:“/chemicalemergencies/category/test-page1.html”中,我需要提取“/chemicalemergencies/” 我已经使用 str_extract 和 regex 来识别模式,但问题是它返回 ANY匹配。如果 URL 有重复的文件夹,这会出现问题。因此,例如,如果路径是“/chemicalemergencies/category/chemicalemergencies/test-page1.html”,它将返回两个结果,而我只需要第一个。如何在字符串中的第一个匹配项后使模式检测停止?
Sys.time()
#i=4
for (i in 1:nrow(wwwdevurls)) {
pathextract_wwwdev <- str_extract(wwwdevurls[i,3],"\\/([A-z0-9]+)\\/")
pathextract_wwwdev.df[i,1] <- pathextract_wwwdev #Load pathextract into pathextract.df
pathextract_wwwdev.df[i,2] <- wwwdevurls[i,1] #Load CIO into pathextract.df
}
Sys.time()
解决方案
使用^[^/]*(/[^/]*/)
斜杠中的第一个目录位于组 1 中。
推荐阅读
- authentication - HowToGraphQL - 第 6 章身份验证 - 为什么调用 postedBy()?
- amazon-web-services - 使用 SAM 的 AWS Lambda 的强制查询字符串参数
- java - 访问 CrudRepository 方法时出现空指针异常
- javascript - 关联 Sequelize Mysql2
- python - Solve_IVP精度
- javascript - 编辑任何单元格为行时的更新时间戳
- python - Python plotly动态绘图
- r - 基于另一个变量创建新列
- firebase - Flutter Firebase Auth 获取密码重置的输出
- linux - ---[结束内核恐慌 - 不同步:VFS:无法在未知块(2,0)上挂载root fs]---