首页 > 解决方案 > 当我抓取数据 python selenium 时,tbody 不会出现

问题描述

我尝试提取表中的数据,但没有成功——”

我在网站上看到: (https://ades.eaufrance.fr/Fiche/PtEau?Code=00696X0126/F2)

这是我的代码:

browser = webdriver.PhantomJS(executable_path = PhantomJSpath)
url = 'https://ades.eaufrance.fr/Fiche/PtEau?Code=00871X0002'
browser.get(url)
browser.implicitly_wait(10)
soup = bs(browser.page_source, features='lxml')
tables = soup.find_all('table')
for elem in tables:
    print(elem)

我得到了表格,但元素“tbody”消失了: 我的刮擦

我做错了什么?如果有人可以告诉我路径谢谢。

标签: python-3.xseleniumweb-scrapinghttpsdatatable

解决方案


元素tbody在您的结果中不存在,因为您正在抓取page_source,但不是实际呈现的 HTML 树。请注意tbody您的浏览器在呈现页面时添加的元素。恕我直言,这根本不是问题,因此您无需担心这个“问题”

PS 我建议使用内置的 Selenium 方法/属性来从页面获取数据,而不是使用 3 方 BeautifulSoup 库


推荐阅读