python - Selenium 没有得到完整的 html 表
问题描述
我尝试使用 selenium 获取 html 表数据,但仅获取页面上的可见信息(大约 30 行),但其余行仅显示:
['', '', '', '', '', '', '', '', '', '']
如果我修改缩放,我可以下载更多的数据,但我需要下载超过 10000 行。
python中的函数是:
def find_all_data(driver):
dat = []
lst = []
element = driver.find_element_by_xpath('/html/body/form/span/div/table/tbody/tr[4]/td[3]/div/div[1]/div/table/tbody/tr/td/table/tbody/tr[2]/td/table/tbody/tr/td/table/tbody')
element
tr_contents = element.find_elements_by_tag_name('tr')
for tr in tr_contents:
for td in tr.find_elements_by_tag_name('td'):
lst.append(td.text)
dat.append(lst)
print(lst)
lst = []
return dat
解决方案
推荐阅读
- pelican - 如何让 Pelican 使用 save_as 元数据来填充规范的 og:url 头部信息?
- apache-kafka - 手动设置 Kafka 消费者偏移量
- keras - 如何在 Keras 中重新初始化图层而不是权重
- regex - 提取超链接 Google Apps 脚本
- c# - iOS自定义渲染不应用角半径
- reactjs - 使用钩子从道具中反应材料表编辑
- c# - 在 EF Core 中使用语法在 dbcontext 内部或外部启动对象是否重要?
- php - PHP while loop + foreach 在同一页面上加倍结果
- javascript - 用于替换 Twitter 单词的 Chrome 扩展
- python-3.x - 从 AWS config 自动修复操作中排除 s3 存储桶