r - 如何在第二次出现模式后解析文本部分?
问题描述
我正在尝试在已解析的 HTML 页面中获取文本部分。文本在页面中多次出现的模式(“项目 c”)之后开始(即:有 3 个“项目 c”)。
当我运行我的代码时,我只解析最后一次出现,而我只需要第一个。
这是第一次出现的 HTML 结构和我用来查找文本开头和结尾的一些代码:
<p>
<font style="display:inline;">Item c. Mike’s bike</font>
</p>...
a <- grep("^Item\\s{0,}c.\\s{0,}M", f.text, ignore.case = TRUE)
b <- grep("^Item\\s{0,}d.\\s{0,}Q", f.text, ignore.case = TRUE)
我尝试了部分单词的完全匹配,但它并不总是有效。
我可以使用索引/更通用的匹配技巧吗?
先感谢您
免责声明:R 相当新:)
解决方案
推荐阅读
- python - pyshark - 如何在实时捕获期间打印目标 IP?
- python - Databricks 火花 UDF 不适用于过滤的数据帧
- mysql - MySQL 单个更新语句 (+) =
- javascript - 通过一种方法使用多个计数器
- css - Vuetify v-list-item 在激活时不会更改文本和图标颜色
- r - 如何确定变量之间的缺失值是否来自同一个 ID 变量?
- python - 在 Django 聚合中使用 exclude
- javascript - 从 AFrame 中的 js 动态发出事件
- java - JPA 按实体或按 ID 映射 OneToOne
- r - 无法从 r 中的拼凑包中收集带有 plot_layout() 的图例