首页 > 解决方案 > 网页抓取后从名称中删除链接字符

问题描述

我正在尝试删除 [e] 或 [f] 等字符,当我们从网站上抓取数据但遇到问题时,这些字符会附加到名称的末尾。我正在使用代码

url= "https://en.wikipedia.org/wiki/Template:COVID-19_pandemic_data#covid19-container" response= requests.get(url) response

inf= response.content scraping = BeautifulSoup(inf, "lxml") scraping element = scraping.find('table') df = pd.read_html(str(element))[0] df

df['countries'] = df['countries'].str.strip('[(.[*]\)]')

但是从上述代码收到的输出不准确,因为我得到了美国 [e ,俄罗斯 [f,英国 [g,西班牙 [h ,德国 [I 等。有人可以帮我解决这个问题吗?谢谢

标签: pythonpython-3.xpython-2.7

解决方案


df['Country'] = df['Country'].str.replace('\[\w\]', "")

这将能够删除方括号和其中的任何内容。


推荐阅读