parsing - 从 url 解析 bibtex
问题描述
我需要在 python 中解析由 url 引用的 bibtex 文件,例如:“ https://www.aclweb.org/anthology/papers/J/J18/J18-1001.bib ”从 bibtex 我需要提取“pages”字段. 如何在python中实现这一点?
解决方案
将其作为字符串读入,然后使用正则表达式获取以下页面的字符串:
import requests
import re
url = 'https://www.aclweb.org/anthology/papers/J/J18/J18-1001.bib'
data = requests.get(url).text
print (re.search(r'(?<=pages = \").*?(?=\",)', data).group())
输出:
'1--15'
推荐阅读
- node.js - Node error thrown upon linking dependencies in React Native (No Expo)
- key-bindings - 是否可以使用 `Ctrl-x Ctrl-s` 键绑定在 nano 编辑器中保存和退出文件?
- node.js - 将 Couchnode 作为 ESM 导入会出现错误“[错误]:JSDoc '@augments' 未附加到类。”
- python - 如何在 dockerfile 多阶段复制可执行文件
- python-3.x - file.open() 以无限循环结束
- java - 为什么我在使用 rs.getInt(1) 时没有获得行 ID?
- javascript - 在 JS 数组映射中反应集合变量
- ssis - SSIS onError 事件处理程序,可以通过 C# 脚本触发另一个事件
- c# - WFP - 重用 DataGrid 列和资源
- node.js - 有没有办法在 VS CODE 中完全使用 twilio 进行开发?