首页 > 解决方案 > 从 url 解析 bibtex

问题描述

我需要在 python 中解析由 url 引用的 bibtex 文件,例如:“ https://www.aclweb.org/anthology/papers/J/J18/J18-1001.bib ”从 bibtex 我需要提取“pages”字段. 如何在python中实现这一点?

标签: parsingbeautifulsoupbibtexpyhook

解决方案


将其作为字符串读入,然后使用正则表达式获取以下页面的字符串:

import requests
import re

url = 'https://www.aclweb.org/anthology/papers/J/J18/J18-1001.bib'
data = requests.get(url).text

print (re.search(r'(?<=pages = \").*?(?=\",)', data).group())

输出:

'1--15'

推荐阅读