首页 > 解决方案 > 如何使用 xpath 从页面中抓取给定的表格?

问题描述

有一页包含多个表格。我想刮任何我想要的桌子。

我注意到使用下面的代码我只能访问第一个表:

import requests
import lxml.html as lh

url= 'some url'

page = requests.get(url)

doc = lh.fromstring(page.content)

tr_elements = doc.xpath('//tr')

for t in tr_elements[0]:
    name=t.text_content()
    print(name)

根据How can I find an element by CSS class with XPath?我试图执行以下操作以访问另一张表。我已经写了

doc.xpath('//*[contains(@class, 'some name of the class')]//tr')而不仅仅是

doc.xpath('//tr'). 然而,这没有给我任何结果。我必须承认我对使用 xpath 的了解非常低,所以我希望得到一个答案,而不是仅仅告诉我有人问过类似的问题。

提前感谢您的帮助。

编辑:

这是网址:https ://biznes.interia.pl/gieldy/notowania-gpw/profil-akcji-mab,wId,6852,tab,przebieg-sesji

标签: pythonweb-scrapingxpath

解决方案


推荐阅读