r - R:基于表格连接文本中的两个单词
问题描述
在 RI 中存在以下问题:
在文本中,我想将一些具有特定含义的单词(从两个到三个)组合在一起。c("a b", "cd e")
在文本中,每当这两个词出现在给定文本中时,我希望拥有相同的文本,但是当这两个词一起出现时,它们用“_”绑定。
示例:这是一个“a”“b”和它的美丽。“cd e”更贵。
会变成:这是一个“a”_b”,它很漂亮。“c_d_e”更贵。
谢谢
解决方案
正则表达式可能是您的解决方案。尝试以下操作:
library(stringr)
text <- "This is an \"a b\" and its beautiful. \"c d e\" are more expensive."
str_replace(string = text, pattern = "(?<=a)[:blank:](?=b)", replacement = "_")
[1] "This is an \"a_b\" and its beautiful. \"c d e\" are more expensive."
"(?<=a):blank:" 此模式匹配所有以 "a" 开头并后跟 "b" 的空格。
然后你可以自己弄清楚如何匹配“c d”等等;)
更多信息请访问:https ://stringr.tidyverse.org/
祝你好运,L
推荐阅读
- xaml - 'local:Class1' 像标记扩展一样使用,但是.. 是否有故障
- python - Pandas,未来警告:使用多个键进行索引
- node.js - solr 添加数组将对象键转换为数组
- javascript - 计算数据库中的数组数量
- powershell - 如何在 Pester 中使用两个互斥参数模拟测试
- reactjs - 有条件地响应本机更改状态
- sql-server - 将使用和加密密码的 SSIS 包从 2008 升级到 2012
- android - 使用 GridLayoutManager 使 RecyclerView 中的某些行具有更少的项目,并具有水平移位
- java - RxJava Single.just 在主线程中
- c++ - 实现 C++ grpc 异步客户端时如何轮询 CompletionQueue?