python - 提取一行中多个url的最后一个元素
问题描述
我在以下模板中有非结构化数据:
'<http://www.wikidata.org/entity/Q1> <http://www.wikidata.org/entity/P31c> <http://www.wikidata.org/entity/Q1454986> .',
'<http://www.wikidata.org/entity/Q1> <http://www.wikidata.org/entity/P227c> "4079154-3" .',
'<http://www.wikidata.org/entity/Q1> <http://www.wikidata.org/entity/P373c> "Universe" .'
我想提取每个 url 的最后一个元素,结果应该是这样的:
'Q1 P31c Q1454986',
'Q1 P227c 4079154-3',
'Q1 P373c Universe'
我已经尝试了一些例子,包括this和this。但是,大多数情况下,他们一行中只有一个链接。
我仍在学习正则表达式,但无法解决上述问题。
解决方案
您想要 2 组,一组介于/
和之间>
,一组介于 和 之间"
/([^/>]+)>|\"([^\"]+)\"
推荐阅读
- c# - 为 OwnesOne 导航属性创建索引
- javascript - 如何从 JSON 数据创建数组而不重复值?
- angular - Angular 6:路由路径附加在查询字符串之后
- reactjs - 将来自 API 的 fetch 调用中的数据附加到我的状态
- c++ - 错误:为函数提供的初始化程序,__THROW __asm
- c++ - 如何提取模板参数中传递的类型?
- ios - 使用非前缀方法在 Swift 中扩展 Objective-C 类是否安全?
- pandas - 计算一组时间戳的小时总和与一个固定数的差
- c# - 失去主窗口的数据上下文
- python - 使用索引作为字符串列表连接 2 个数据帧时出错