r - 是否有正则表达式可以在两个正斜杠之间和特定字符串之后查找字符串?[R]
问题描述
我有一个数据框,其中有一列包含这样的 URls:
https://www.facebook.com/nameofpage/posts/13142894231
我试图仅nameofpage
将此列的一部分提取到一个新列中。我无法弄清楚如何在该确切位置提取字符串。字符串有时包含文字“.”、文本和数字。
我一直在尝试使用strsplit
和separate
从 tidyr 取得有限的成功。
tidyr 代码如下所示:
separate(Link, c(NA, NA, NA, "target"), sep = "/")
但是,这根本不起作用。
我希望将其提取nameofpage
到列中,但有时输出实际上是 URL 的另一部分。
解决方案
您可以str_split
从stringr
包装中使用。
URL = "https://www.facebook.com/nameofpage/posts/13142894231"
library(stringr)
str_split(URL, "/")
[[1]]
[1] "https:" "" "www.facebook.com" "nameofpage"
[5] "posts" "13142894231"
str_split(URL, "/")[[1]][4]
[1] "nameofpage"
推荐阅读
- c# - C# Content.ReadAsAsync
- java - 设置 java HTTPS 服务器,让我们加密公钥和私钥
- javascript - CSS 元素的颜色没有正确改变
- c++ - 如何取消引用 nullptr 并返回正确的对象?
- python - 如何使用 Python 在目录中查找最新文件
- django - IntegrityError:“user_id”列中的空值违反非空约束(Django Rest Framework)
- c# - 将排序字典转换为数组
- python - 在 Django 中更新表单
- angular - Angular中模块之间的路由
- python - 从包含对象的列表中获取数据