首页 > 解决方案 > 仅提取节标题的句子部分

问题描述

我有一个小问题。

我的文字看起来像:

B.1 My name is John

我只想获得:

My name is John

我很难同时忽略 B 和 1

标签: r

解决方案


你可以用sub一个正则表达式来做到这一点。

TestStrings = c("B.1 My name is John", "A.12 This is another sentence")
sub("\\b[A-Z]\\.\\d+\\s+", "", TestStrings)
[1] "My name is John"          "This is another sentence"

\\b 表示单词边界(消除多个字母)

[AZ] 将匹配一个大写字母。

\\. 将匹配一个时期

\\d+ 将匹配一个或多个数字

\\s+ 将匹配任何训练空格。

匹配的部分将替换为空字符串。


推荐阅读