python-3.x - 当我抓取数据 python selenium 时,tbody 不会出现
问题描述
我尝试提取表中的数据,但没有成功——”
我在网站上看到: (https://ades.eaufrance.fr/Fiche/PtEau?Code=00696X0126/F2)
这是我的代码:
browser = webdriver.PhantomJS(executable_path = PhantomJSpath)
url = 'https://ades.eaufrance.fr/Fiche/PtEau?Code=00871X0002'
browser.get(url)
browser.implicitly_wait(10)
soup = bs(browser.page_source, features='lxml')
tables = soup.find_all('table')
for elem in tables:
print(elem)
我得到了表格,但元素“tbody”消失了: 我的刮擦
我做错了什么?如果有人可以告诉我路径谢谢。
解决方案
元素tbody
在您的结果中不存在,因为您正在抓取page_source
,但不是实际呈现的 HTML 树。请注意tbody
您的浏览器在呈现页面时添加的元素。恕我直言,这根本不是问题,因此您无需担心这个“问题”
PS 我建议使用内置的 Selenium 方法/属性来从页面获取数据,而不是使用 3 方 BeautifulSoup 库
推荐阅读
- networking - 将网络划分为 4 个子网 - 卡住
- tensorflow - 关于 tensorflow.contrib.eager.metrics.Mean() 的错误
- dialogflow-es - 如何在 Google 操作执行中使用或提供 AAC 格式的音频
- php - 如何通过添加活动类在 Bootstrap 轮播中从数据库中动态插入 src
- sql - 使用特定值从多个表中删除一条记录
- ios - 仅在空投部分的底部更改 UIActivityViewController 背景颜色
- php - 删除 foreach PHP 中的每个项目
- android - 如何在 Kotlin 中获取 Retrofit 的原始 json 响应?
- docusignapi - 如何使用信封-java从docusign下载签名文档
- pyspark - 用点“。”计算一列数据框的 approxQuantile