首页 > 解决方案 > 如何在由 rtf 文档创建的字符向量中找到两个元素之间的元素

问题描述

我有一个使用代码从 rtf 文档创建的对象:(sample_doc <- read_rtf("sample.doc") 我不得不使用 read_rtf,因为该文档实际上是一个 rtf)。

我知道文档中的某处有两个短语(字符向量中的一个元素)appleorange并且它们之间必须有一个元素。我只想提取中间元素。我应该怎么办?

谢谢!

标签: rregexcharacterstringrquanteda

解决方案


您可以使用正数lookbehindlookahead目标之间的模式,这个正则表达式应该给你你需要的东西:

(?<=orange)(.*)(?=apple)

推荐阅读