r - 如何从R字符串中提取某些单词?
问题描述
我对解析数据比较陌生。
我有一个包含以下示例文本数据的数据集,该数据集非常遵循这种格式:
"Blessed to receive an offer from Texas State University."
"Blessed to receive an offer from Columbia University."
在“来自”之后提取学校名称的好方法是什么?
我知道 stringr 和 pattern,但似乎找不到正确提取学校名称变化的方法。
解决方案
使用str_extract
(并假设所有 uni 名称后紧跟一个句点):
data <- c("Blessed to receive an offer from Texas State University.",
"Blessed to receive an offer from Columbia University.")
UniNames <- str_extract(data, "(?<=from\\s).*(?=\\.)")
结果:
UniNames
[1] "Texas State University" "Columbia University"
推荐阅读
- c# - 如何在 C# (SOAP) 中发出 POST Web 请求
- java - Is there a way in Java to intercept the creation of a object by using Instrumentation?
- web-scraping - 使用 Scrapy 获取结构化输出
- c++ - OpenVINO 演示:多通道人脸检测演示;TBB LINK 2019 错误
- java - 是否有可能有一个“HotReload”基于 docker 的 java 环境?
- c++ - 构造函数与数组初始值设定项的歧义
- swiftui - 如何将全局应用程序状态桥接到模型视图(使用@ObservedObject)?
- docker - docker ps 仅列出名称和状态
- azure - Azure 函数保存到没有内容标题的文件
- python - 使用python将十六进制地址.xlsx文件转换为csv int